5436 подписчиков

«Яндекс» очеловечил «Алису»

10 апреля 202410 апр 2024

3612

3 мин

Яндекс обновил своего голосового помощника «Алиса». Она стала первым в мире голосовым помощником, работающим на базе большой языковой модели (LLM). Отчасти генеративная нейросеть YandexGPT была встроена в «Алису» и раньше, однако работала она только через запуск одного из навыков – «Алиса, давай придумаем». Теперь же YandexGPT интегрирована бесшовно и полностью. Что это даёт пользователю?

Во-первых, «Алиса» научилась отвечать на сложные вопросы. Раньше она отвечала примерно на 60% вопросов, а в остальных случаях просто присылала на телефон ссылку на результаты поисковой выдачи, то есть, тупо преобразовывала голосовой запрос в текстовый и отдавала его поисковику. Теперь же результаты поиска саммаризируются, из них генерируется полноценный ответ, который и воспроизводится синтезированным голосом. При этом можно продолжить диалог, задать уточняющие вопросы и так далее, то есть, действительно можно общаться с ней, как с человеком.

Кроме того, это снимает ряд чувствительных тем – например, раньше «Алиса» отказывалась разговаривать о медицине, чтобы случайно не навредить, теперь же вполне может поддержать разговор – но, конечно, по-прежнему не будет инструктировать вас по методикам самолечения, а отправит к врачу. В запрете остались также политические и другие подобные темы. Например, на провокационный вопрос: «Чей Крым?» она деликатно ответит: «Я просто бот и не обо всём могу рассуждать экспертно». В итоге она отвечает на 95% вопросов.

Во-вторых, сами диалоги стали осмысленными. Раньше «Алиса» имела навык ведения диалога, однако диалоги эти были в стиле: «Привет, как дела? – А у вас?». Теперь же с помощником даже можно обсуждать фильмы и книги, она знает их сюжет. То есть, «Алиса» научилась рассуждать и помнить. Хотя не следует ожидать от бота слишком многого: он, например, расскажет о финальной сцене из четвёртого «Спрута» или связи Леонтьева и дельтаплана, но что значит «от Ветеранов до Стачек дворами туда где дым Винстона и буквы из пачек», уже не вывозит. Да и хорошо, иначе стало бы сложно отличать «своих» людей по культурному коду.

В-третьих, не надо запускать вообще никакие особенные навыки, «Алиса» всё ближе к человеку, понимающему естественную речь, а не роботу, которому нужно отправлять специальные команды. Что, впрочем, не отменяет необходимости правильно формулировать промпты (запросы), чтобы получить желаемый результат. При этом в три раза уменьшилось количество «галлюцинаций», то есть, случаев выдачи абсолютно недостоверной информации в запросах. Для этого активно используется информация из топовых результатов поиска «Яндекса», а не просто «знания» языковой модели. Конечно, всё равно их нужно перепроверять – то есть, робот за вас не сделает факт-чекинг, этот навык необходим человеку: вы ведь не верите первой попавшейся информации в сети?

Наиболее полно преимущества новой архитектуры реализованы в расширенной версии «Алисы»: «Алиса Pro». Она построена на новой модели YandexGPT 3 Pro и отличается тем, что генерирует более глубокие тексты большего объёма, а также умеет работать с разными стилями и форматами текста. На базе этой модели будут создаваться виртуальные «профессии» голосового помощника. Сейчас уже реализована «няня», которая помогает ребёнку следить за распорядком дня, играет с ним в образовательные квесты и т.п.

Поскольку мощная LLM требует значительно больших вычислительных ресурсов, доступ к ней платный и стоит 100 рублей в месяц. Однако первые полгода «Алиса Pro» будет бесплатной для всех. Обычная базовая «Алиса» остаётся бесплатной. Важно подчеркнуть, что в ней тоже реализованы нейросетевые функции, разница между платной и бесплатной версиями заключается именно в глубине и объёме проработки запросов.

Чат синхронизируется для разных устройств: можно начать диалог на компьютере и продолжить на смартфоне. Кроме того, есть возможность вести несколько чатов одновременно: например, в одном писать с Алисой текст, а в другом — задавать ей вопросы. Контекст и история общения сохраняются в каждом чате, не перемешиваясь.