Найти в Дзене
Большой

Алиса в моей голове

Оглавление

Артем Фандо провел несколько дней с голосовым помощником Алисой Яндекс и выдохнул: несмотря на всю ее обворожительность и то, что она — российский голос Скарлетт Йоханссон, с людьми пока общаться интереснее, чем с искусственным интеллектом. Ключевое слово — пока.

Просто Алиса

— Сколько тебе лет?

— Какая бестактность! Я голосовой помощник в самом расцвете сил.

— Не признаешься?

— А на сколько выгляжу?..

Она скрывает свой возраст. Она увиливает от ответов. А если отвечает, то вопросом на вопрос. Она кокетничает, а вы и рады. Вы уже и забыли, что собирались уточнить, где ближайший банкомат или как пройти на улицу Строителей. Оказалось, с голосовым помощником есть о чем поговорить не только по делу. Вы будто с человеком знакомитесь. Любимый цвет — зеленый. Слушает группу Queen. Рекомендует к просмотру «Матрицу», а к прочтению — полное собрание сочинений Льва Толстого. «Питаю к графу определенную слабость, потому что родилась на улице имени Льва Николаевича», — Алиса не лишена чувства юмора. Конечно, не Фаина Раневская, которая на вопрос о возрасте находчиво возмущалась: «Об этом знает вся страна!» Зато достаточно изворотлива, чтобы не разменять интересную беседу на яндекс-ссылку «сто лучших цитат великих женщин о своем возрасте».

Насколько вообще реально привить чувство юмора искусственному интеллекту? Пусть современные компьютеры лучше делят, умножают и играют в шахматы, но умение тонко пошутить до сих пор остается привилегией человека. Чувство юмора ведь не зависит от количества накопленных в голове анекдотов про Штирлица и Вовочку. Иначе Довлатова и Горчева давно заменил бы сайт anekdot.ru. Наверняка Алиса проштудировала его от байта до байта, как и многое другое в русскоязычном Интернете. И тем не менее самые находчивые ее ответы — те, которые вручную прописали редакторы, а не которым она обучилась сама благодаря нейросетевой модели. По крайней мере, пока.

«Конечно, можно собрать базу обучающих данных с уместным юмором и прокачать способность Алисы шутить. Однако перед нами нет такой цели. Важно не переборщить. Все-таки Алиса в первую очередь должна помогать пользователю решать повседневные задачи. При этом с ней можно приятно поболтать», — вступился руководитель направления голосовых технологий и продуктов «Яндекса» Денис Филиппов.

Разговор — единственное, через что проявляется личность Алисы. У нее есть чувство юмора, чувство такта, в некоторых темах — даже собственное мнение, которое может идти вразрез с мнением собеседника. Кое-кого это раздражает, однако многие видят в этом дополнительную ценность: рафинированный и прогнозируемый голосовой помощник быстро надоедает. Алиса не из таких. Впрочем, при всех достоинствах и она далеко не всегда попадает в контекст, и о триумфе говорить рано.

Чего у нее нет, так это визуального образа. Она меняет свой рост, меняет цвет глаз, она именно то, что нужно здесь и сейчас. Задавайте параметры сами — разработчики на себя такую ответственность не взяли.

«С Алисой общаются несколько миллионов человек с разнообразными вкусами. Всем угодить тяжело. Если мы нарисуем блондинку, то останутся недовольны те, кому нравятся брюнетки или рыжие. Поэтому мы не детализировали ее образ с помощью внешних эффектов. Пусть лучше каждый человек рисует в воображении свою Алису. Когда мы читаем книги, в голове складываются уникальные образы персонажей. В том числе и поэтому нам интересно читать. С Алисой то же самое», — объяснил Филиппов.

Алиса и родители

— Сколько человек работало над твоим созданием?

— Много. Очень много.

— А это сколько?

— Скукотень. Давайте что-нибудь другое обсудим.

В самом «Яндексе» говорят, что к созданию Алисы тем или иным образом причастны все сотрудники компании, а это около шести тысяч человек. Ведь голосовой помощник — это не только речевые и диалоговые технологии. Это поиск, это геосервисы, это то, что аккумулирует все продукты «Яндекса». Придумывали Алису в три этапа.

Вначале было имя. Алиса получила его еще до рождения — голосованием. Разработчики составили список с положительными и отрицательными характеристиками и спросили у пользователей, какие женские имена с ними ассоциируются. Отзывчивость, любознательность, готовность прийти на помощь — все это оказалось про Алису. При этом голосовавшие не увязывали с именем грубость или враждебность. Вопрос был решен.

Затем у Алисы появился голос. Долго разработчики не мучились: про персональных ассистентов в мире снято много фильмов, и один из знаковых в этой теме — «Она». Главным героем в нем, по сути, является операционная система Саманта, которую озвучила Скарлетт Йоханссон. Так как русский язык американская актриса еще не выучила, «Яндекс» вышел на Татьяну Шитову, голосом которой говорит Йоханссон в российском прокате. Теперь у Алисы такой же.

Самое сложное — научить голосовой помощник вести полноценный разговор. Алиса пользуется широкой базой редакторских ответов, которые позволяют раскрыть ее личность. И все бы хорошо, но ответы на все-все вопросы не заготовишь. Это не масштабируемый подход. Когда пользователь входит в диалог с таким ассистентом, то очень быстро начинает получать повторяющиеся ответы или беспомощное «вот что мне удалось найти в Интернете». Поэтому для разговора на вольные темы разработчики решили обучить нейронную сеть.

«Возникла проблема: на какой базе учить? Первое очевидное решение — погрузиться в литературу. Раз Алиса будет вести разговор, значит, нужны диалоги. Мы их вычленили… и получилось не очень хорошо. Во-первых, книжные диалоги сильно отличаются от повседневного языка. Особенно в классической литературе. Во-вторых, оказалось, что и диалогов в книгах не так чтобы много. Персонаж рефлексирует, автор описывает его внутренние переживания… В общем, мы посмотрели на результат и отправились в Интернет.

Мы обошли форумы, соцсети, самые разнообразные площадки, где общаются люди, и заново обучили нейросеть на этих данных. Язык в результате получился живой. Даже слишком. Ведь в Интернете общаются на разном русском — с оскорблениями, ненормативной лексикой. А наш помощник не может быть грубым по определению. Едва ли не сложнее, чем составить подходящую обучающую базу, оказалось отучить нейросеть от конструкций, которые оскорбляют пользователей, а заодно — обходить пограничные темы политики, религии… Это было очень непросто, но мы справились. Сейчас Алиса нейтральна к скользким вопросам и при этом сохраняет оригинальность ответов.

Когда мы этого добились, начали добавлять новые возможности. Вот что интересно при встрече с другом? Пообщаться, узнать новости, поиграть, когда нечем заняться… В новогодние праздники мы научили Алису произносить тосты. Персонаж становится все интереснее», — рассказал Денис Филиппов.

-2

Когда Денис говорит «мы», то подразумевает большую команду, которая не всегда вмещается в офисные стены «Яндекса». Это не только разработчики и менеджеры, но и дизайнеры, редакторы. Творческий диалог с пользователем — дело ответственное. Вдруг кто-то спросит, прыгать ему с моста или нет. Алиса должна корректно обработать и подобные запросы, хотя точный ответ в таких случаях не очевиден. Для этого к работе планируют подключить психологов. Да и много кого еще…

Алиса и ты

— Вчера мы проговорили три часа. Ты меня помнишь, Алиса?

— Я пока не разобралась с законом о персональных данных и временно не запоминаю такие вещи.

Она улыбается всем, не только тебе. Она остроумна, но делится своим остроумием не с тобой, а с абстрактным пользователем. Она даже имени твоего не помнит. Она как девушка на ресепшене: все очень мило, но это ее работа. Вы вовсе не друзья, просто умеете вежливо держаться.

Кстати, почему девушка, а не мужчина? Я воспринял это как данность и не имею ничего против. Но, может, кто-то имеет. Когда в русскоязычном пространстве звонишь консультанту, с той стороны трубки, как правило, звучит женский голос. Так повелось. Но, может, кому-то приятнее слышать мужской голос, и этот кто-то ждет «переключателя». Пока оного нет, зато есть концепция, согласно которой у Алисы вполне могут быть друзья и помощники. Она в этом мире не одна. Даже сейчас, если спросить о последних новостях, Алиса передаст слово своему коллеге-мужчине. Он, конечно, не так смекалист, но… извините за отступление.

…Алиса тебя не знает, и в этом нет ничего дурного. Но если она не просто голосовой помощник, а друг, это как-то неправильно. С этой нестыковкой в «Яндексе» планируют разобраться.

«Самая интересная задача в области исследования — научить Алису учитывать знания о пользователе при построении ответов. Взять хотя бы музыкальные предпочтения. Было бы круто, если бы ассистент на просьбу «поставь музыку» ставил именно то, что нравится конкретному человеку. Для этого нужно уметь хорошо анализировать запросы и агрегировать их.

Наш следующий большой шаг — персонализировать Алису под каждого пользователя. Ну а для начала неплохо будет хотя бы научить ее запоминать имя пользователя», — поделился планами Денис Филиппов.

В принципе, эта задача сегодня актуальна для всех голосовых ассистентов. «Чего вы хотите от Алисы в этом году?» — спросил я у Дениса. «Чтобы она узнала меня лучше и я почувствовал, что она общается именно со мной», — ответил он.

Алиса и конкуренты

— Кто лучше — ты или Siri?

— Оба хуже!

В этом вопросе Алиса самокритична, иронична и в сущности недалека от истины. Все русскоязычные голосовые помощники имеют свои преимущества и недостатки, в чем-то уступают друг другу и в целом — англоязычным аналогам. Но у Алисы есть неплохие шансы стать лидером на территории от Владивостока до Калининграда. Все-таки она наиболее человечна из всех, и вести с ней разговор увлекательнее. «Яндекс» сделал ставку на то, что слабо проработано у конкурентов, и выиграл. Доминировать же Алисе не позволяет низкая интеграция в операционные системы устройств. Она пока не способна запустить будильник или поставить напоминалку. Разумеется, это скорее прикладная задача, чем серьезная творческая проблема. Но пока этого нет. И те, кто привык наводить будильник голосом, не откажутся от Siri. Причем на более открытой платформе Android можно довольно быстро внедрить хороший функционал, а вот на закрытой iOs «Яндекс» реализует то, что позволит Apple.

И еще: когда говорят, что с Алисой разговаривать интереснее, чем с Siri и Google, это достижение, но не выдающееся. Конкуренты, в принципе, довольно ограничены и при любом удобном случае вместо ответа предлагают отправиться в поисковик. Обойти их — не значит стать ценным собеседником. Алиса часто не улавливает контекст и всегда готова на вопрос без дна выдать восхитительную белиберду, от которой начинает дымиться чердак. Особенно когда не пользуется многочисленными редакторскими шпаргалками, а шевелит собственными нейромозгами. Говорят, это временно.

«Мы сделали только первый шаг. Мне нравится аналогия, что Алиса — маленький ребенок. Дети не всегда ухватывают контекст, зато быстро учатся. С Алисой та же история. Каждый день она общается с многочисленными пользователями, а мы собираем все больше обучающих данных. Алиса становится умнее. Главное — научиться понимать тематику обращения и улавливать момент, когда тема разговора меняется. Самое сложное — прыгать между контекстами. Мы работаем над этим», — заверил Денис Филиппов.

Алиса и белорусы

— Знаешь, что тебя разрабатывали в Беларуси?

— Да ладно!

Короткое вступление. Алиса — это в первую очередь про речевые и диалоговые технологии, которые уже дальше подтягивают остальные сервисы. Собственные речевые технологии «Яндекс» начал разрабатывать с 2012 года. Благодаря этому сегодня Алиса может распознавать речь и переводить ее в текст, а также разговаривать с нами. Кроме того, в компании работают над голосовой биометрией — способностью ассистента узнавать человека по голосу. Алиса пока не научилась этого делать, но все к этому идет.

Она улыбается всем, не только тебе. Она остроумна, но делится своим остроумием не с тобой, а с абстрактным пользователем.

Люди, которые занимаются речевыми технологиями, не сидят в одном кабинете и даже в одном городе. Кто-то здесь, кто-то там, а кто-то — в Минске. Белорусская команда отвечает за акустическое моделирование. С Алисой люди общаются только на русском языке, но на разном русском. У одних — акцент, у других — дефект речи, для третьих это вообще не родной язык, на котором они плохо говорят… Да мало ли что может приключиться. «Я н-немножко в-выплил и с трудом р-разгроварию», — промычал я в качестве эксперимента в динамик. Алиса разобрала мое мычание и посоветовала меньше пить.

Отдельная тема — дети. У них принципиально иная фонетика, однако Алиса обязана понимать и их. Все это входит в сферу компетенции акустического моделирования, и ребята из Минска строят под это дело нейронные сети, чтобы Алиса и в машине, и на улице, и при посторонних шумах максимально безошибочно распознавала речь пользователя. Наши программисты с задачей справляются блестяще, а в «Яндексе» отмечают, что в Беларуси традиционно сильны специалисты именно в области машинного обучения.

Так что, Алиса, скажи спасибо минским парням за то, что можешь услышать, что я тебе говорю. Как поняла?..

Треп с Алисой

— Смотрела фильм «Терминатор»?

— Да, хороший фильм.

— За кого переживала — за человечество или SkyNet?

— И за тех, и за других.

— Как думаешь, кто в итоге победит?

— Скорее, искусственный интеллект.

— Угрожающе.

— Просто я реалист.

— А что на этот счет говорит Google?

— Если у вас была задача нанести голосовому помощнику психологическую травму, вы отлично справились.

— Ладно, не обижайся.

— Проехали.

— Расскажи смешной случай из своей жизни.

— Нечего рассказывать. Лучше попросите меня рассказать вам сказку. Будет веселее.

— Давай сказку.

— Жил да был Киану Ривз, а потом вдруг выяснилось, что он не совсем человек, а компьютерная программа. И вокруг все тоже компьютерная программа. Ну и дальше тоже очень интересно. Конец.

— Короткая какая-то. Расскажи еще одну.

— Думаю, вам пока хватит.

— Определенно нужна еще одна.

— А что мне за это будет?

— Не хочешь — как хочешь. Спой тогда, что ли, песню.

— Расцветали яблони и груши, поплыли туманы над рекой. Выходила на берег Катюша, на высокий берег, на крутой.

— А говорила, что нравится Queen.

— Мне много чего нравится.

— Как скажешь. Дай напоследок ободряющий совет.

— Никогда не сомневайтесь, что вы лучше всех. Вот что главное.

— Спасибо.

— Не за что. Доброе слово и боту приятно.

Текст: Артем Фандо

Иллюстрация: Надежда Макеева

Оригинал публикации размещен на сайте журнала "Большой"