Искусственный интеллект GPT-3 продолжает свое развитие во всем мире. В декабре Сбербанк выпустил русскоязычную версию с простым интерфейсом, которая позволяет генерировать контент на русском уже сегодня.
Тестирование русской модели GPT-3 Large
GPT-3 — это нейронная сеть 3 поколения, на основе искусственного интеллекта, которая умеет писать музыку, делать дизайн, программировать, а также генерировать уникальные тексты.
На платформе Sbercloud представлена русскоязычная модель GPT-3 Large. Она включает в себя 760 000 000 параметров и может:
Генерировать текст на русском и английском.
Продолжать программный код.
Отвечать на вопросы.
Проверим, кто лучше: человек или ИИ. Вбиваем фразу «Лечение наркомании в Санкт-Петербурге». Первые 5 попыток дают нелепые и смешные результаты:
Уточняем задачу. В окно «затравки» вбиваем «Лечение наркомании в Санкт-Петербурге подробный текст». Результат был удачным:
Получили контент на 1 255 символов с пробелами. Очень неплохого качества, со знанием дела и тематики.
Пробуем сделать еще один текст. Теперь GPT-3 сразу понял нашу задачу и выдал результат с первой попытки. Версия стала лучше, на 1312 символов с пробелами и походила на классический контент статейного сайта по наркологии.
Как Сбербанк разрабатывал GPT-3
Вернемся немного в прошлое. 22 октября 2020 года Сбербанк выложил в открытый доступ первую русскоязычную модель GPT-3, о чем сразу сообщили многие порталы. Однако, пользоваться ей могли только пользователи с минимальными навыками, о чем говорил представитель разработчика.
Татьяна Шаврина, Лидер команды AGI NLP Сбербанка:
Работа с уже обученными моделями проста. Требуется уметь скачивать и запускать готовое решение и минимальный набор навыков уровня Junior Data Scientist: Язык программирования Python. Понимание смысла одной метрики качества (перплексии). Для реализации собственной задумки на основе GPT-3 нужна уже идея и навыки прототипирования.
Выпуск состоялся 4 декабря — тогда Сбербанк презентовал web-интерфейс для тестирования, а 15 декабря объявил о коммерческом запуске ML Space — облачной платформы для решений на основе GPT-3. Именно его мы сегодня и тестировали.
ML Space позиционируется как единственная система, позволяющая обучать ИИ более чем на 1 000 графических процессорах (GPU).
Планы Сбербанка большие:
Сделать цены на программу самыми низкими — 3 рубля за GPU-минуту обучения и препроцессинга, 12 копеек за CPU-минуту, 0,054 копейки за инференс модели.
Выдавать предпринимателям гранты до 1 000 000 рублей на внедрение и обучение ML Space.
Результаты тестовой версии нас удовлетворили.
Итог
Русская версия GPT-3 существует только в исполнении Сбербанка. Правда, среди экспертов и вебмастеров есть мнение, что это лишь попытка создать свой ИИ по образу оригинала.
Основные причины для отсутствия русских приложений на GPT-3:
Трудность получения реального доступа.
Высокие затраты на разработку и обучение.
Тем не менее, решение Сбербанка практично, позволяет генерировать контент даже в тестовом доступе. Очевидно одно — технология GPT-3 развивается большими темпами, и появление полноценного программного обеспечения на русском языке лишь вопрос времени.