Найти в Дзене
Доктор Мур

Алиса-искусственный интеллект.

«Алиса уникальна своей человечностью»: так начал своё выступление Михаил Парахин. Михаил – директор по технологиям в компании «Яндекс». Он разобрал Алису на части и рассказал нам о том, как это всё работает. Голосовой помощник делает много интересных вещей. Поиск информации в интернете, заказ для такси или пиццы всё это сделает она. Ещё с Алисой можно поболтать. Давайте разберёмся в технологиях, которые позволяют создавать такое инженерное чудо. Для того что бы Алиса поняла нас, нужно распознать наш голос. За это отвечает технология SpeachKit. Вы скажите, что в этом трудного? Но помните, что Алиса слышит нас через микрофон, её приходиться разбираться с шумами, диалектами, акцентами, сленгом. На выступлении Михаил показал видео, как маленькая девочка общается с Алисой, это очень впечатляет. Потому что я не всё мог разобрать, а бот понимал девочку без проблем. Потом я узнал, что Алиса обогнала человека по качеству распознавания речи ещё пол
Оглавление

«Алиса уникальна своей человечностью»: так начал своё выступление Михаил Парахин. Михаил – директор по технологиям в компании «Яндекс». Он разобрал Алису на части и рассказал нам о том, как это всё работает.

Голосовой помощник делает много интересных вещей. Поиск информации в интернете, заказ для такси или пиццы всё это сделает она. Ещё с Алисой можно поболтать. Давайте разберёмся в технологиях, которые позволяют создавать такое инженерное чудо.

Вспомните как разговаривают дети в 2 года, не понимаешь что говорят.
Вспомните как разговаривают дети в 2 года, не понимаешь что говорят.

Для того что бы Алиса поняла нас, нужно распознать наш голос. За это отвечает технология SpeachKit.

Вы скажите, что в этом трудного? Но помните, что Алиса слышит нас через микрофон, её приходиться разбираться с шумами, диалектами, акцентами, сленгом.

На выступлении Михаил показал видео, как маленькая девочка общается с Алисой, это очень впечатляет. Потому что я не всё мог разобрать, а бот понимал девочку без проблем. Потом я узнал, что Алиса обогнала человека по качеству распознавания речи ещё полгода назад.

Как у неё это получилось?

Обычный человек за свою жизнь слышит 100 000 000 фраз. Команда Алисы собрала более миллиарда фраз. Это 3 года непрерывного звучания с разными шумами, в разных ситуациях, с акцентами, фразы людей разного возраста. Получается, что Алиса услышала огромное разнообразие высказываний и звучания. Человек не смог бы услышать такое количество диалогов за всю свою жизнь.

-3

После того, как бот распознал речь, превратил фразу в текст, необходимо его наделить смыслом и сформировать ответ. За это отвечает технология Turing.

Алиса берёт высказывание и транспортирует его в семантическое пространство высокой размерности.

Для того чтобы легче понять, представьте что вы пытаетесь поставить журнальный столик в комнату. Вы учитываете многие факторы. Столик должен красиво смотреться, не мешать, что бы свет хорошо на него падал, и при этом вы его располагаете в трехмерном пространстве. Алиса делает примерно тоже самое только в 100-х измерениях. Она ищет для фразы место, потом анализирует соседние высказывания, которые находятся рядом, и пытается подобрать ответ. При этом в это семантическое пространство входят 100 000 000 диалогов из классической литературы, из форумов. Так же она анализирует общение с вами. Разным людям в разное время Алиса отвечает по-разному.

Алиса нашла ответ, теперь его нужно произнести.

За это отвечает технология Text-to-Speech.

Вроде всё просто, взяли актера, записали слова, склеили их и вот голосовой ответ. Но когда речь сформированная таким образом, она звучит не естественно. Так разговаривают роботы. В человеческой речи больше половины информации - паравербалика (интонации, логические ударения, паузы). Разработчики решали собирать речь из фонем. После этого в речи появились посторонние звуки, и что бы их сгладить подключили нейронную сеть. Получилась речь похожая на человека.

Подписывайтесь.