Современный ИИ генерирует миллионы текстов в секунду, не превращаемся ли мы в тех самых «обезьян», которые если будут бить по клавишам бесконечно долго, то рано или поздно напечатают произведения Шекспира? Конечно, вы все знаете ту самую идею, которую называют «теорема о бесконечных обезьянах». Но откуда она взялась? И сколько на самом деле нужно времени для этого? Давайте разбираться вместе.
От сатиры Свифта к математической теории
Всё началось задолго до интернета и даже до появления настоящих печатных машинок. В 1726 году Джонатан Свифт в своей знаменитой книге «Путешествия Гулливера» описал абсурдную «машину слов» в Академии Лагадо. Это была рама, на которой болтались карточки со словами. Ученики трясли её, ловили случайные комбинации и записывали то, что получалось, как будто это были осмысленные предложения.
Свифт высмеивал тогдашние попытки «механизировать» науку – создавать знания без понимания, просто перебирая варианты. Его идея была не про обезьян, а про опасность слепого доверия к формальным методам.
Но… спустя почти два века эта сатира превратилась в серьёзный мысленный эксперимент!
В начале XX века французский математик Эмиль Борель предложил такую формулировку: если дать обезьяне печатную машинку и бесконечное время, она рано или поздно напечатает любое произведение. Позже эту идею упростили и популяризировали. Теперь это знаменитая «теорема о бесконечных обезьянах», которые рано или поздно напечатают Шекспира.
Так о чём на самом деле говорит эта теорема? Здесь важно не путать математическую истину с практической реальностью.
С точки зрения теории вероятностей, утверждение действительно верно. Если процесс полностью случайный и продолжается бесконечно долго, то вероятность того, что когда-нибудь появится любой заранее заданный конечный текст (например, тот же самый «Гамлет»), стремится к 100 %. То есть «почти наверняка» это произойдёт.
Но… «почти наверняка» – это не то же самое, что «скоро» или «в обозримом будущем»!
Сколько понадобится времени, чтобы «обезьяны создали Шекспира»?
Учёные-математики и энтузиасты создали онлайн-симуляторы «обезьян за машинками», чтобы показать, насколько редко возникает даже минимальная осмысленность в потоке случайных символов. Эти эксперименты не опровергают эту теорему, а, наоборот, подчёркивают её главный урок: в теории – всё возможно, но в реальности – почти ничего не происходит.
На самом деле, ожидаемое время, за которое обезьяна напечатает даже короткую фразу из Шекспира, настолько велико, что превосходит возраст Вселенной в миллиарды раз.
Представим, что обезьяна печатает случайную последовательность, используя все строчные буквы русского алфавита. В нём 33 буквы:
а, б, в, г, д, е, ё, ж, з, и, й, к, л, м, н, о, п, р, с, т, у, ф, х, ц, ч, ш, щ, ъ, ы, ь, э, ю, я.
Каждый раз, когда она нажимает клавишу, она случайно выбирает одну из этих 33 букв с равной вероятностью, без цели, без смысла.
Теперь зададимся вопросом: сколько существует разных комбинаций из, скажем, 20 таких букв?
На первый взгляд – «ну, много». Но на самом деле – непостижимо много.
Почему? Потому что:
- на первое место можно поставить любую из 33 букв;
- на второе место снова любую из 33;
- то же самое для третьего, четвёртого… и двадцатого символа.
А значит, общее число возможных 20-буквенных строк – это:
В точной записи это число равно:
2 345 734 188 103 679 287 078 463 273 601
Это 2,345… × 10³⁰, то есть более двух нониллионов возможных комбинаций для строки из 20 букв, составленной только из строчных букв русского алфавита!
Для сравнения:
- Весь наблюдаемый космос содержит около 10²⁴ звёзд.
- Возраст Вселенной менее 10¹⁸ секунд (!), не часов или лет.
Даже если бы у нас было миллиард обезьян, печатающих по миллиону символов в секунду, им всё равно не хватило бы времени с момента Большого взрыва, чтобы с заметной вероятностью получить хотя бы одну такую фразу.
Вы осознаете, насколько огромно это число, это количество времени?!
Именно поэтому, хотя теоретически обезьяна может напечатать, например, строку «бедный йорик я знал его горацио» (а ведь на самом деле есть ещё заглавные буквы и знаки препинания: «Бедный Йорик! – Я знал его, Горацио.»), на практике это никогда не произойдёт!
И не потому, что невозможно, а потому, что реальность слишком коротка для бесконечности.
А что, если случайность иногда «угадывает»?
Интересно, что у Свифта в той же «Лапуте» есть ещё один любопытный эпизод: астрономы якобы предсказали существование двух спутников Марса за 150 лет до их реального открытия!
Сегодня мы знаем, что это совпадение было неточным, но оно породило легенду. В связке с «машиной слов» это создаёт интригующий образ – а вдруг среди бесконечного потока случайных текстов иногда мелькает не просто бессмыслица, а нечто, удивительно близкое к истине? Тот же самый «Гамлет»?
Возможно. Но даже если такое случится, как отличить «почти правду» от случайного совпадения? Ведь в океане случайных комбинаций будут встречаться и точные цитаты, и ложные пророчества, и бессвязные наборы слов, которые кажутся осмысленными. Без понимания, без контекста, без критического мышления. Мы просто не узнаем, где здесь знание, а где шум.
Это как нейросети, которые уже сегодня могут написать прекрасный текст, но в нём будет масса технических ошибок, выдуманных дат и цифр.
Вместо заключения
История об обезьянах и печатных машинках – это не просто забавная «теорема о бесконечных обезьянах». Она оставляет больше вопросов, чем ответов. Она заставляет нас задуматься: что такое знание? Можно ли создать его, просто перебирая варианты? И насколько мы сами, в эпоху генераторов текста, похожи на тех самых учеников из Академии Лагадо, которые ловят случайные слова и надеются, что из них сложится смысл?
И главный вопрос: а если современный ИИ генерирует миллионы текстов в секунду, не превращаемся ли мы в тех самых «обезьян», которые ждут, пока из хаоса родится шедевр?
Возможно, Вам будет интересно:
Благодарю, что дочитали до конца. Лайк – лучшее спасибо мне, как автору!