Привет, Алиса.
Так вот, иногда я умудрялась поверить
в целых шесть невероятных вещей до завтрака.
Л. Кэрролл «Приключения Алисы в Стране Чудес»
1865 г.
В списках крупнейшей конференции Яндекс - YaC 2018 (Yet another Conference 2018), которая проходила в Москве в конце мая, было двое ведущих, которые представляли доклады были Аркадий Волож - «руководит всем яндексом» (цит. с сайта конференции ) и Алиса. Алиса - это программный код, который создан для того, чтобы помогать человеку в решении его повседневных задач. На сцене была представлена в виде визуальной проекции на экране и периодически дополняла докладчиков, напоминала им о том, что он забыл сказать и отвечала на вопросы к радости зрителей. Никого не удивить тем, что она понимает речь человека, может распознавать образы на фотографиях и отвечать человеку или другой программе.
Давайте попробуем провести анализ такой системы, оставляя только то, что уже реализовано, а не то, что находится в состоянии развития. Что умеет интеллектуальный помощник и как это изменит нашу жизнь?
В недалеком прошлом, для взаимодействия с компьютером, человеку было необходимо осваивать язык машины, уметь писать программный код. Этот навык безусловно является полезным и актуальным в настоящее время, он будет находить только новые применения в различных областях в будущем. Искусство программистов уже дошло до такого уровня, что они научили машину понимать человеческую речь. В настоящее время, для того, чтобы объяснить компьютеру, что мы от него хотим, нет никакой необходимости вводить программный код, достаточно просто произнести это вслух. О системах голосовых помощников, встроенных в смартфоны (Алиса, Siri, ok, Google и др.) вы конечно же слышали. Такие системы анализировали самое большое количество слов, произнесенных человеком, и с этим они справляются лучше, чем кто бы то ни было на Земле. Такая система должна разбираться в сленговых выражениях, анализировать диалекты и заимствованные слова, при этом убирать посторонние шумы, которые попадают через микрофон, а всё это, в совокупности превращается в достаточно сложную задачу. Голосовой ассистент от компании Яндекс - «Алиса» превзошел человека по качеству распознавания речи в середине прошлого года (2017). По статистике среднее значение количества слов, которые слышит человек равняется 150 млн., Алиса уже проанализировала 1 млрд. слов (3 года работы) и продолжает накапливать информацию, используя запросы миллионов пользователей (по данным компании «Яндекс» на 53% устройств, подключенных к сети Интернет, установлен голосовой помощник «Алиса»).
Что же ещё умеет такой помощник? Писать текст под диктовку, переводить текст на разные языки, вызывать абонента по голосовой или видео связи, писать ему сообщения, планировать расписание на день и даже заказывать билеты на самолёт или в театр, напомнить о погоде и многое другое. Список таких функций можно продолжить, но на самом деле он всё равно будет неполным, потому что каждый использует его своим способом. У каждого свои запросы, а это в корне меняет подход к повседневным задачам, ведь для некоторых из них были введены отдельные должности в крупных компаниях.
Давайте для наглядности рассмотрим, как работает следующий запрос для голосового помощника: «Какая погода в Санкт-Петербурге?»
Актуальный запрос для тех, кто собирается посетить конкурс «Учитель года России» в 2018 году. Что происходит после того, как вы задали вопрос? По ключевому слову «погода» Алиса понимает о чём идет речь и нужно выяснить дальше «В каком городе?» необходимо узнать информацию о погоде и «На какую дату?». Если нет уточнения, то речь идет о настоящем моменте. В случае, если нужен прогноз на неделю, то срабатывает алгоритм: текущая дата +1 (повторить 7 раз). Естественно это всего лишь прогноз, Алиса не даёт никаких гарантий, что такая погода действительно будет, но она анализирует всю информацию, которая есть на данный момент в Интернете по данному запросу и выдает пользователю результат.
С такими интеллектуальными сервисами, практически всю работу делает за пользователя кто-то другой. Удобно ведь для того, чтобы произошло какое-то действие, нужно только дать команду и алгоритм начинает выполнение уже без твоего участия. Напоминает мультфильм «Вовка в тридевятом царстве» (реж. Б.П. Степанцев, 1965 г.).
- Вы, чего, и конфеты за меня есть будете? - Ага!
Поэтому такой процесс взаимодействия должен быть продуманным, ведь правильно сформированный запрос даст правильно сформулированный ответ.
В завершении хотел бы рассказать об одном примере, из учительской практики. Задания вроде, что изображено на картинке или в какой стране сделана фотография (любой вопрос, связанный с анализом изображения), теряют всякий смысл, даже если вы потратили на поиск подходящего изображения несколько часов. Наши дети справятся с этим за несколько секунд, просто сфотографировав на телефон и попросив Алису распознать картинку.
Я не хотел в статье давать никаких прогнозов о будущем данной технологии, поэтому вернусь в прошлое. Еще 3 года назад, читатели этой статьи решили, что данный текст рассказывает о совершенно невозможных вещах.