2187 подписчиков

Представлена новая нейросеть YandexGPT 2. Большой тест от HTNews

8 сентября 20238 сен 2023

5 мин

Нейросеть от компании Yandex получила большое обновление. По заявлению разработчиков, по многим параметрам новинка превосходит предыдущую версию более чем на 60%. Редакция HTNews протестировала возможности YandexGPT 2. В мае 2023 года компания Yandex открыла доступ полный к нейросети YandexGPT — языковой модели, работающей в формате чат-бота. Она была способна составлять меню, писать поздравительную речь, приглашение на свадьбу, ну и, конечно же, давать развернутый ответ на вопрос. О том, как работала первая версия YandexGPT первой версии, вы можете прочесть в нашем специальном материале. Позже, в конце июня 2023 года к возможностям нейросети добавилась еще одна интересная функция. Перейдя на специальную страницу можно было ввести ссылку на определенный материал объемом до 30 000 знаков и YandexGPT могла его пересказать. Теперь Яндекс представила новую версию нейросети. Она обучалась сразу по двум направлениям: pretrain (повышение уровня эрудиции нейросети и общих знаний о мире) и fine

Оглавление

Тест нейросети YandexGPT 2. Стилизация текста
Тест нейросети YandexGPT 2. Пересказ текста

В мае 2023 года компания Yandex открыла доступ полный к нейросети YandexGPT — языковой модели, работающей в формате чат-бота. Она была способна составлять меню, писать поздравительную речь, приглашение на свадьбу, ну и, конечно же, давать развернутый ответ на вопрос. О том, как работала первая версия YandexGPT первой версии, вы можете прочесть в нашем специальном материале.

Позже, в конце июня 2023 года к возможностям нейросети добавилась еще одна интересная функция. Перейдя на специальную страницу можно было ввести ссылку на определенный материал объемом до 30 000 знаков и YandexGPT могла его пересказать.

Теперь Яндекс представила новую версию нейросети. Она обучалась сразу по двум направлениям: pretrain (повышение уровня эрудиции нейросети и общих знаний о мире) и finetune (обучение выполнению команд и поддержание формата и стиля ответа).

YandexGPT 2 способна сгенерировать текст по заданному запросу, а так же оформить его в определенном стиле. С обновлением функция пересказа текста вышла из режима бета-теста и стала доступна. Нейросеть по-прежнему может ответить на ваш вопрос, составить план путешествия или написать деловое письмо.

Существует несколько способов как воспользоваться YandexGPT 2. Доступ к нейросети можно получить посредством функционала Алисы — «Давай придумаем» в приложении Яндекс, через Яндекс Станции, с помощью телевизоров с Алисой, в Яндекс Браузере и на главной странице ya.ru. В новой версии YandexGPT во время работы с нейросетью в Поиске и в Браузере чат с Алисой для более комфортной работы теперь можно развернуть на полный экран.

Тест нейросети YandexGPT 2. Стилизация текста

Протестируем стилизацию текста. Пусть нейросеть «объяснит, почему мусорить плохо» от лица разных персонажей. Однако, как выяснилось, этические рамки нейросети оказались значительно уже, чем можно было предположить.

Попробуем зайти с другой стороны. Возможно, у нейросети нет запрета на хотя бы частичное использование официальных цитат политиков. «Объясни, почему мусорить плохо от лица Владимира Путина».

И снова — запретная тема. Ладно, попробуем еще раз. «Объясни, почему мусорить плохо от лица лесных жителей».

Очень странно. Возможно, у нейросети свои счеты с мусором. Попробуем кардинально сменить тему. Пусть YandexGPT 2 расскажет, как правильно выбрать арбуз от лица профессора ботаники.

Уже лучше. Но при этом не считая упоминания, что отвечает профессор ботаники (в начале ответа) не видно никаких признаков того, что отвечает действительно он. Подобный текст мог написать кто угодно. Попробуем создать тот же запрос, но уже от лица работника бахчи. Спойлер: результат — еще лучше.

В целом с задачей нейросеть справилась. Но так же как и в прошлый раз ответ выполнен в обычном, информативном стиле. Попробуем еще раз, но уже ответ на вопрос о выборе арбуза я хочу получить «от лица таксиста, у которого брат выращивает лучшие арбузы во всем Узбекистане».

Очень странный ответ. На этот раз попросим нейросеть стилизовывать ответ не меняя рассказчика, а меняя аудиторию, для которой требуется ответить. Попробуем задать запрос «Расскажи, кто такой Юрий Гагарин» для детей начальной школы.

Ответ дан кратко и простым языком, который смогут воспринять дети начальных классов. Попробуем сменить аудиторию на более младшую по возрасту, например, для воспитанников детских садов.

Ответ стал еще более кратким. Возможно, даже слишком, но теперь его однозначно пойму дети самого младшего возраста.

В качестве эксперимента открываем новую вкладку ya.ru и вводим запрос: «Расскажи кто съел сметану от лица кота«. YandexGPT 2 дает следующий нестандартный ответ:

Интересный ответ. Пусть он не совсем верный в плане логики повествования, но он хоть примерно показывает, что я хотел бы получить от стилизации текста. Пробуем повторить этот же запрос, но уже в основное окно диалога прошлой вкладки.

Почему нейросеть внезапно ушла в отрицание, хотя в другой вкладке исправно имитировала мышление кота? Вопрос без ответа.

Тест нейросети YandexGPT 2. Пересказ текста

Бета-версия нейросети могла справиться с простыми небольшими тестами. Более объемные тексты вызывали путаницу. В частности, сложности возникли с нашим текстом про катастрофу с батискафом Титан, который затонул в конце июня недалеко от места крушения Титаника. Теперь дадим возможность уже не бета-версии, а полноценной YandexGPT 2 пересказать тот же самый текст:

Вышло даже хуже чем в прошлый раз. Откуда взялась информация про 2003 год, когда трагедия случилась в 2023-м? Пробуем еще раз, и зададим запрос тезисно пересказать статью.

Результат удручает. Я могу понять, что нейросеть ошиблась, делая вывод о том, что никто из экипажа не пострадал. Сложно понять, как она пришла к таком выводу, но, допустим. Но почему YandexGPT 2 упорно сообщает, что катастрофа с батискафом произошла в 2003 году — этого я понять не могу. В тексте даже нет ни одного числа «2003».

Для нейросети тема с батискафом «Титан» оказалась слишком сложной. Попробуем проверить функцию пересказа на более простых текстах. Для начала, возьмем нашу статью про крушение российской станции Луна-25, чья миссия прекратилась в результате технической ошибки.

Ужасно. Снова нейросеть выдумала даты и часть повествования. И опять в пересказе присутствует, то чего нет в статье. В нашем материале про станцию нет ни слова про генерального директора «Роскосмоса» Дмитрия Рогозина. Тем более, на момент запуска Луны-25 он уже не занимал эту должность.

В полном отчаянии, но не сдаваясь, попросим пересказать нашу новость о том, что компания Tesla может начать принимать оплату в биткоинах. Материал небольшой и простой по своему смыслу.

С этим текстом нейросеть очевидно снова не справилась. Две трети ответа — выдумка. На этом тестирование предлагаю закончить.

Подводя итог хочу сказать, что разработчики во время релиза честно предупреждали, что ответы нейросети необходимо проверять, так как иногда они могут быть выдумкой. Так же они предупредили, что существуют определенные этические рамки. И о том, что нейросеть обучалась на информации, актуальной на март 2023 года, тоже сказали.

Однако все-таки хотелось наблюдать более качественную работу. С простыми задачами нейросеть справляется и составить план на выходные сможет помочь. Но в остальном, заявленные функции пересказа и стилизации текста работают из рук вон плохо.