Найти в Дзене

Как ИИ научился слышать

1966 год, Кембридж. Студентка Массачусетского технологического института сидит за терминалом и печатает: «Я чувствую себя несчастной. Все кажется бессмысленным» . Ответ приходит мгновенно: «Расскажи мне больше о своей семье» . Но на другом конце провода — не человек, а программа ELIZA . Это был первый в истории чат-бот, который обманул человечество, имитируя разум. История машинного слуха началась с таких вот «разговоров», где ИИ не понимал слов, но умел играть в слова. До 1950-х компьютеры «слышали» только через перфокарты. Но в 1952 году в Bell Labs создали AUDREY — первую систему распознавания речи. Как это работало: Факт: AUDREY потребляла 100 Вт энергии — как 10 ноутбуков. В 1966 году Джозеф Вейценбаум создал ELIZA — программу, которая пародировала разговор психоаналитика с пациентом. Секрет успеха: Скандал: Студенты MIT часами делились с ELIZA секретами. Вейценбаум писал: «Люди забывали, что это машина. Это пугало» . В 1972 году Терри Виноград представил SHRDLU — систему, которая
Оглавление

Машина, которая притворилась психотерапевтом

1966 год, Кембридж. Студентка Массачусетского технологического института сидит за терминалом и печатает: «Я чувствую себя несчастной. Все кажется бессмысленным» . Ответ приходит мгновенно: «Расскажи мне больше о своей семье» . Но на другом конце провода — не человек, а программа ELIZA . Это был первый в истории чат-бот, который обманул человечество, имитируя разум. История машинного слуха началась с таких вот «разговоров», где ИИ не понимал слов, но умел играть в слова.

Глава 1: Первые шаги — речь как физика, а не смысл

До 1950-х компьютеры «слышали» только через перфокарты. Но в 1952 году в Bell Labs создали AUDREY — первую систему распознавания речи.

Как это работало:

  • Устройство размером с холодильник распознавало цифры от 0 до 9 на английском.
  • Анализировало частоту звуковых волн (формантный анализ).
  • Точность: 90%... но только для голоса разработчика, который обучал систему неделями.

Факт: AUDREY потребляла 100 Вт энергии — как 10 ноутбуков.

Глава 2: ELIZA — психотерапевт из перфокарт

В 1966 году Джозеф Вейценбаум создал ELIZA — программу, которая пародировала разговор психоаналитика с пациентом.

Секрет успеха:

  • ELIZA использовала шаблоны . Например, на фразу «Меня мучает тревога» она отвечала: «Расскажи, почему тебя мучает тревога?» .
  • Программа не понимала контекст, но создавала иллюзию эмпатии.

Скандал: Студенты MIT часами делились с ELIZA секретами. Вейценбаум писал: «Люди забывали, что это машина. Это пугало» .

Глава 3: SHRDLU — когда ИИ понял, о чем говорят

В 1972 году Терри Виноград представил SHRDLU — систему, которая управляла виртуальным миром из блоков и отвечала на вопросы.

Как это выглядело:

  • Пользователь: «Поставь красный куб на синюю пирамиду» .
  • SHRDLU анализировал синтаксис, семантику и физику объектов.
  • Если блок был слишком тяжелым, система отвечала: «Красный куб не помещается на пирамиду. Хочешь, я возьму меньший?» .

Прорыв: SHRDLU стал первым ИИ, который связывал язык с действиями . Но его код занимал 150 страниц, а обработка одной команды длилась минуты.

Глава 4: Зима ИИ и возвращение через статистику

В 1980-х распознавание речи застопорилось. Символические системы вроде SHRDLU не справлялись с реальным миром. Но в 1990-х все изменилось:

  • Скрытые марковские модели (HMM) научились предсказывать слова по вероятностям.
  • Дракон-3 (1997) — первый массовый речевой движок для ПК — распознавал 20 000 слов.
  • IBM ViaVoice (1999) позволял диктовать текст со скоростью 100 слов в минуту.

Курьез: В 1990-х 50% ошибок распознавания приходилось на фразу «распознай речь» — система слышала «распоряжение речи» .

Глава 5: Deep Learning — революция в облаках

2010-е: нейросети и большие данные изменили всё.

  • Google Voice Search (2012) использовал глубокие сети для анализа аудио.
  • WaveNet (2016) синтезировал речь, неотличимую от человеческой.
  • Siri, Alexa, Алиса — голосовые помощники стали повседневностью.

Факт: Современные системы распознают речь с точностью 98%, но для обучения требуют 10 000 часов аудио и 100 GPU.

Эпилог: От ELIZA до нейросетей — мы говорим с машинами

Сегодня ИИ не только слышит — он понимает эмоции, диалекты, даже шепот. Но все началось с примитивных шаблонов и «слушающих» машин размером с холодильник.

P.S. В следующий раз, когда вы спросите у Алисы прогноз погоды, вспомните: её прабабушка ELIZA жила в перфокартах и не знала, что такое «дождь».

#ИИ #ГолосовыеАссистенты #ИсторияТехнологий #ELIZA #Нейросети

Если хотите узнать, как ИИ победил чемпиона мира в го — готовлю пост о DeepMind. Ставьте ❤️, чтобы не пропустить!