Найти тему
iXBT.com

GigaChat Сбера научился распознавать изображения, а также рукописный текст, формулы, графики и таблицы

Команда СберБанка объявила о запуске новой полезной функции генеративной нейросети GigaChat. Система искусственного интеллекта GigaChat Pro теперь поддерживает работу с изображениями как источником информации и обрабатывает в четыре раза больше данных за один запрос.

Сгенерировано нейросетью Dall-E  📷
Сгенерировано нейросетью Dall-E 📷

В качестве запроса пользователь может отправить иллюстрацию, чтобы сервис использовал её как дополнительный контекст. Модель определит, сколько людей на фото, во что они одеты, даст совет по стилю одежды и многое другое.

Также модель научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные, которые в них содержатся. Например, студенты могут сфотографировать часть учебного материала или конспекта, загрузить изображение и в несколько кликов получить короткое содержание текста, его ключевую тему и сформировать план дальнейшей работы с ним.

Модель GigaChat Pro доступна бесплатно всем пользователям через веб-версию, Telegram и «ВКонтакте». Разработчикам и бизнесу модели доступны через GigaChat API.