Технологии разговорного ИИ уверенно вошли в нашу повседневную жизнь. Виртуальные ассистенты, такие как Алиса от Яндекса и Маруся от VK, выполняют команды пользователей. Многие компании используют чат-ботов для общения с клиентами. А переводчики на базе ИИ позволяют людям разговаривать на разных языках без необходимости знать их.
В каких областях эти технологии могут применяться в дальнейшем? Заменят ли разговорные агенты людей на рабочих местах? Появится ли в скором времени у ИИ эмоциональный интеллект?
На эти вопросы ответил Андрей Валерьевич Носов, руководитель группы обработки естественного языка Отраслевого центра разработки и внедрения информационных систем ОАО «РЖД» и спикер новой образовательной программы на Сириус.Курсах.
— Почему технологии обработки естественного языка стали так популярны в последнее время? Чем это можно объяснить?
Я вижу здесь сонаправленное движение человека и бизнеса. Люди осознают пользу в том, что разговорный ИИ позволяет гораздо быстрее решать повседневные задачи и при этом оставлять время для себя. Объёмы информации растут, и очень многое начинает зависеть от скорости и качества их обработки. Пользу видит и бизнес: он вкладывает деньги, влияя на рост качества данных и улучшение алгоритмов ИИ. В результате нужных приложений в самых разных областях становится всё больше.
— Как работает разговорный ИИ? Объясните максимально доступно для всех, кто не изучал тему.
Это система, способная общаться с людьми. Что нам обычно нужно для диалога? Умение понять собеседника и способность ему ответить. В базе разговорного ИИ лежат оба этих механизма, связанных с обработкой языка, поэтому система может понимать, интерпретировать и генерировать человеческий язык.
Сначала машина c помощью технологии NLP (natural language processing) обрабатывает различные виды ошибок человека при запросе — начиная с грамматических, которые уже хорошо классифицированы, и заканчивая когнитивными, которые пока изучены плохо. Например, ИИ не всегда может распознать сарказм или понять шутку.
Дальше машина понимает смысл полученного запроса и делает из него выводы. За это отвечает область NLU (natural language understanding). ИИ максимально подробно классифицирует все виды поступающих запросов, чтобы мгновенно на них реагировать. Здесь можно провести параллель с посещением библиотеки: внутри все книги будут стоять на своих полках. Но если их раскидать по разным местам, то на поиск нужного издания может уйти много времени.
Наконец, машина отвечает на запрос человека. Производством контента занимается модель генерации. Она привыкла складывать текст из кучи слов, но самостоятельно не сможет исправить ошибки или определить, употреблено слово правильно или нет. Лишь в связке с NLU и NLP генеративная модель способна приносить пользу и создавать контент на основе осознанного понимания.
— Частой проблемой разговорных агентов является то, что с ними просто неинтересно общаться. Почему так происходит и как это изменить?
Во-первых, разговорные агенты ограничены в знаниях, поэтому важно постоянно расширять их информационную базу, например, подключать к интернету. Во-вторых, часто нам неинтересно общаться с ИИ из-за отсутствия эмоций, кто-то даже называет его бездушной коробкой. Учёные осознают эту проблему и активно работают в области развития эмоционального интеллекта машин. Например, в прошлом году на Петербургском экономическом форуме настоящий фурор произвела робот Дуняша, продававшая мороженое. В неё были заложены три модели общения: ребёнок, родитель и обычный взрослый. Она анализировала модальность, с которой к ней обращались, и отвечала аналогичным образом. Такое поведение помогло увеличить число продаж — людям нравилось, что с ними говорили на одном языке.
Ещё один важный момент связан с отсутствием персонализации. Человеку хочется разговаривать с конкретным и живым собеседником. Для этого разговорным агентам часто дают любимые имена. Сейчас за персонализацию отвечают корпорации, и это не всегда устраивает потребителей. Например, у нас в РЖД существует виртуальный помощник Валера, и в разных подразделениях просят поменять ему имя: люди хотят называть его Кириллом или Эдуардом, так им комфортнее выстраивать коммуникацию. И вот здесь развивается направление на стыке лингвистики и психологии — ToV (tone of voice), где тщательно продумываются профайлы разговорных помощников с присущими им основными чертами и характеристиками. Это делает их человечнее.
— Какие перспективы для человечества открывает разговорный искусственный интеллект? В каких областях его смогут применять в будущем?
Во многих, включая и самую загадочную — человека, его эмоции и любовь. Помните, как в фильме «Она» искусственный интеллект входит в доверие и становится близким другом? Настолько близким, что расставаться с ним больно и трудно. Фильм поучительный: он показывает, что будет, если ИИ начнёт манипулировать эмоциями человека.
К счастью, мы живём не в кино, и сегодня исследователи всё больше задумываются о том, чтобы сделать ИИ советником человека в личных вопросах. Не так давно Стэнфордский университет анонсировал работу над ассистентом отношений. ИИ поможет человеку построить отношения с другими людьми: даст совет, как их начать, комфортно развить или завершить. В каждой ситуации порекомендует, что сказать любимому человеку, и спрогнозирует последствия. Но, конечно, это только подсказки: окончательное решение, следовать им или нет, принимает человек.
— А как быть с этической стороной вопроса? Не всем нравится начинать отношения с обмана. А поддержка ИИ-ассистента в выстраивании диалогов, где место только двоим людям, ощущается как обман.
Может и так. А может, все будут только рады. Кому сейчас нужны миллионы ошибок в отношениях? Многие хотят жить счастливо здесь и сейчас. Мало кто хочет получать эмоциональные травмы и проходить в личной жизни через семь кругов ада. ИИ поможет избежать всех этих трудностей.
— Всё чаще можно слышать тезисы о том, что ИИ — серьёзная угроза для людей и со временем лишит многих из нас работы. Например, чат-боты с ИИ заменят интервьюеров на собеседованиях...
Думаю, что до этого ещё далеко. В развитии ИИ лежат несколько базовых принципов. Возможно, многие вспомнят про основной закон робототехники, сформулированный Айзеком Азимовым: «Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред». Это глубоко философская мысль, которая понимается по-разному. Но есть ещё более базовые принципы. Например, такой: если я могу выключить ИИ, значит, это хорошая машина.
Ещё людям важно понимать, как алгоритмы ИИ работают и принимают решения — тогда их проще контролировать. Отсюда вытекает второй базовый принцип: если я не понимаю машину, то не смогу ей управлять.
— Какие ещё принципы этики и безопасности учитываются при разработке разговорных систем?
Должна быть обеспечена конфиденциальность и безопасность данных. Разработчики используют квантовое шифрование, которое делает взлом невозможным: там очень большие числа, которые компьютер, даже самый мощный и современный, не способен просчитать.
Ещё может использоваться обфускация или запутывание кода. Чтобы подстраховаться, разработчики намеренно раскидывают по всему коду ошибки. Даже если третьи лица возьмутся расшифровывать код, они не смогут его прочитать.
— Как вы сами применяете разговорных агентов в своей жизни?
Дома у меня целый хоровод ассистентов. Я называю их «рой» и ставлю над ними эксперименты. Например анализирую, могут ли голосовые агенты решать проблемы сообща. Многие люди считают, что истина рождается в споре. Голосовые помощники создаются разными группами разработчиков и учитывают, прежде всего, их предпочтения. Они автоматизируют только то, что понятно их создателям, поэтому есть шанс собрать как будто бы несколько мнений. Я задаю агентам задачу и наблюдаю, какие решения они принимают, как дополняют друг друга. Если голосовые помощники научатся приходить к единому мнению, то смогут многое: например, усилить область предсказательной аналитики. Сейчас прогнозные модели используют только исторические данные, на основании которых принимается решение. Продуктивный спор разговорных агентов может стать альтернативным подходом.
— Что мотивирует вас продолжать работу в области ИИ?
Чувство, что мы находимся только в начале пути, а сами технологии — в зачаточном, базовом виде. Мне хотелось бы увидеть момент, когда ИИ встанет с человеком на один уровень и начнёт общаться с ним на одном языке.