Найти в Дзене

Распознавание речи: история о том, как роботы научились понимать людей

Как показывает ваша история, идеи создания человекоподобных роботов посещали людей с древних времен.
Антропоморфные машины появились еще в античности. Они не решали никаких задач и служили для развлечения публики.
Свои первые слова роботы произнесли в 30-х. Примерно в то же время появились устройства с «ушами».
Первым роботом, который научился слушать, я считаю почтенного мистера Телевокса - изобретение американского инженера Уэнсли (1927). Телевокс был секретарем-диспетчером в мире роботов. Создатель наделил его двумя способностями: идентифицировать и реагировать.
В Телевокса были встроены 3 камертона, которые распознавали звуки разной частоты. С помощью них робот понимал, что нужно сделать. Он получал команду по телефону: серией гудков человек сообщал Телевоксу указания. По словам разработчика, робот мог выключать свет, прогревать духовку, набирать ванну и многое другое. Получался такой себе аналоговый «умный дом».
Для тех времен технология была прорывной, хотя в массовое производств

Как показывает ваша история, идеи создания человекоподобных роботов посещали людей с древних времен.
Антропоморфные машины появились еще в античности. Они не решали никаких задач и служили для развлечения публики.
Свои первые слова роботы произнесли в 30-х. Примерно в то же время появились устройства с «ушами».
Первым роботом, который научился слушать, я считаю почтенного мистера Телевокса - изобретение американского инженера Уэнсли (1927). Телевокс был секретарем-диспетчером в мире роботов. Создатель наделил его двумя способностями: идентифицировать и реагировать.
В Телевокса были встроены 3 камертона, которые распознавали звуки разной частоты. С помощью них робот понимал, что нужно сделать. Он получал команду по телефону: серией гудков человек сообщал Телевоксу указания. По словам разработчика, робот мог выключать свет, прогревать духовку, набирать ванну и многое другое. Получался такой себе аналоговый «умный дом».
Для тех времен технология была прорывной, хотя в массовое производство прадед Алисы и Маруси так и не вышел.

-2

Следующей значимой вехой в истории развития систем распознавания речи стала машина по имени Одри. Её изобрели в 1952 в лаборатории Белла (того самого, который запатентовал телефон). Машина представляла собой огромный шкаф, полный аналоговых реле и перфокарт. Её единственной (уникальной! прорывной! беспрецедентной!) функцией стало распознавание произнесенных цифр от 0 до 9. Скрипя своими электрическими мозгами, машина узнавали цифру и «подсвечивала» её на табло. Сложность состояла в том, что с высокой точностью (97%) Одри узнавала только голос своего создателя, который, собственно, и настраивал ее динамик. Другие дикторы получали точность 70-80%, а неподготовленные люди видели правильно подсвеченную цифру только в половине случаев.
Несмотря на отсутствие практической пользы, Одри доказала ученым, что машинное распознавание речи в принципе возможно. А также подсказала основные проблемные места, над которыми стоит работать – различия в произношении у разных людей, скорость речи и т.д. Так что бабуле Одри лично я от души благодарен.

-3

Вслед за Одри в 1962 году появилась машина Shoebox от корпорации IBM. По размерам машина напоминала – догадались что? – ну верно, обувную коробку. Shoebox понимала уже 16 слов – некоторые цифры и простые арифметические знаки: «плюс», «минус», «равно». Фактически, она была калькулятором на голосовом управлении: человек диктовал в микрофон простые примеры, а машина передавала их счетному аппарату, который печатал это всё на бумаге.

-4

В 60-е обучение машин восприятию и воспроизведению аудио стало мейнстримом. Разработки велись в СССР, США, Великобритании и Японии. Основной задачей изобретателей стало создание нового алгоритма, который воспринимал бы не монолитные слова и не буквы, а именно отдельные звуки, какими они слышатся в речи. Нерешенной оставалась проблема разных тембров голоса, которую когда-то обозначила Одри.

Кто первым справился с решением этих непростых задач, вы узнаете в следующей статье.

А что, вы надеялись, что я сразу всё раскрою?

Ещё больше интересных материалов читайте в моём паблике во "Вконтакте".