Найти тему
OVERCLOCKERS.RU

GigaChat достиг нового уровня: теперь ИИ распознает жесты и создает музыку

На высокопрофильной конференции AI Journey, ставшей ключевым событием в области искусственного интеллекта, ведущие разработчики Сбербанка сообщили общественности об обновлении GigaChat. Этот чат-бот, основанный на языковой модели с удивительными 29 миллиардами параметров, приобрел новые функциональности, направленные на трансформацию взаимодействия с искусственным интеллектом в истинное удовольствие для пользователей.

Одним из важных аспектов обновленной версии GigaChat стала его способность генерировать музыку по индивидуальным запросам. Теперь, помимо визуальных и текстовых элементов, бот обретает музыкальный талант. Например, он может создавать расслабляющие мелодии по запросу пользователя, предоставляя аудиофайлы в формате MIDI для прослушивания и последующей обработки. Этот революционный шаг стал возможным благодаря интеграции моделей CLaMP и SymFormer, последняя из которых обучена на огромном массиве данных, включающем более 200 тысяч песен и мелодий различных жанров.

Кроме того, обновленный GigaChat приобрел функционал редактирования PDF-документов через веб-интерфейс, что сделает взаимодействие пользователя с ботом еще более удобным и эффективным. Эта функция объединяет усилия бота с двумя моделями - SAGE, предназначенной для коррекции правописания, и Kandinsky, использованной для создания изображений.

Однако инновационным шагом, который станет доступен лишь для разработчиков через API, является возможность распознавания жестов. GigaChat, согласно заявлению разработчиков, обладает уникальной способностью понимать более 2500 жестов и формировать предложения, основываясь на контексте. Планы интеграции этой функции в пользовательскую версию GigaChat будут анонсированы в ближайшее время, раскрывая новые перспективы в использовании искусственного интеллекта.

📃 Читайте далее на сайте