1949 год. Холодная война. Лейтенант ВВС США Питер Тома получает задание: создать машину для мгновенного перевода русских документов. Военные щедро финансируют проект. Команда лучших лингвистов и инженеров работает годами.
Их система должна понимать грамматику, контекст, смысл. Они корпят над правилами, алгоритмами, словарями. Проект «ПАНДА» поглощает миллионы долларов.
Результат? Полный провал. Машина выдавала абракадабру. «Дух готов, но плоть слаба» она перевела как «Водка хороша, но мясо протухло». Военные в ярости. Финансирование режут. Проект закрывают.
Но Тома не сдается. Он понимает: не нужно учить машину «понимать» язык. Достаточно просто найти статистические совпадения. Он берет груды уже переведенных ООН документов (русский-английский). И заставляет компьютер искать паттерны: какое английское слово чаще всего соответствует русскому?
Это был хак. Обходной путь. Гениальное упрощение. Машина не «знала» язык. Она играла в угадайку на гигантских массивах текста. И это сработало