В конце 1960-х учёные были в шаге от того, чем мы пользуемся сегодня. Машины, которые учатся сами, узнают образы, подстраиваются под данные. И тут выходит небольшая научная книга. Без скандалов, без громких заявлений. Просто аккуратный математический разбор. А через пару лет финансирование почти всех работ по обучающимся машинам схлопывается, лаборатории закрываются, тема становится почти неприличной. Звучит как преувеличение. Но это правда, и история эта до сих пор многих поражает.
Сначала был восторг
Чтобы понять, что случилось, вернёмся чуть назад. В середине XX века психолог Фрэнк Розенблатт придумал устройство, которое назвал перцептрон. Если совсем по-простому, это была первая попытка собрать искусственный аналог нервной клетки. Представьте крошечного помощника, который смотрит на картинку и говорит: «это похоже на букву» или «не похоже». Сам, без жёсткой программы под каждый случай. Его не программировали в привычном смысле. Его обучали. Показывали примеры, он ошибался, его поправляли, и со временем он угадывал всё лучше. Примерно как ребёнок, который сначала называет кошкой всех пушистых зверей, а потом начинает различать.Это была сенсация. О перцептроне писали газеты, его показывали публике, делали смелые прогнозы про думающие машины. Атмосфера была почти праздничная. Казалось, ещё немного, и машины научатся видеть и понимать мир.
А потом вышла книга
В 1969 году двое крупных учёных из Массачусетского технологического института, Марвин Минский и Сеймур Пейперт, выпустили книгу под названием «Перцептроны». Это не был памфлет и не разоблачение. Это была строгая, честная математика. Авторы взяли простейший перцептрон, тот самый, однослойный, и доказали: у него есть жёсткий потолок. Есть задачи, которые он не решит никогда, сколько ни обучай.Самый знаменитый пример звучит почти обидно по своей простоте. Перцептрон не мог справиться с операцией, которую в логике называют «исключающим или». Это когда ответ «да» нужен в случае, если верно что-то одно из двух, но не оба сразу. Бытовая аналогия: вы согласны пойти гулять, если на улице тепло ИЛИ если у вас выходной, но если совпало и то и другое разом, у вас уже другие планы. Простому перцептрону такая логика оказалась не по зубам. И это математически безупречно доказали.
Тонкость, которую почти все пропустили
И вот тут самое интересное. Минский и Пейперт писали про ОДНОСЛОЙНЫЙ перцептрон. Про самый простой. А выход из тупика был известен в принципе уже тогда: нужно складывать такие элементы в несколько слоёв, один над другим. Многослойная сеть как раз умеет то, чего не умеет одиночная. Грубо говоря, один работник не справится с задачей, а бригада, где каждый делает свой кусок и передаёт дальше, справится легко.Проблема была в другом. Никто толком не знал, КАК обучать такую многослойную бригаду. Поправлять один элемент просто. А как распределить «работу над ошибками» по всем слоям сразу, чтобы каждый понял, в чём именно он был неправ? Внятного способа не было. И книга, по сути, честно указала на стену. Но многие прочитали её иначе: не «вот граница простой модели», а «вся эта затея бесперспективна».
Двадцать лет тишины
Дальше сработала не только математика, но и человеческий фактор. Минский был фигурой огромного авторитета. Когда такой человек показывает слабое место направления, деньги утекают мгновенно. Финансирование работ по обучающимся сетям почти иссякло. Этот период позже назовут одной из «зим искусственного интеллекта» — временем разочарования и заморозки. Молодые учёные уходили в другие темы, ведь карьеру на «бесперспективном» не построишь.А ещё трагическая деталь. Фрэнк Розенблатт, отец перцептрона, погиб в начале 1970-х, не дожив до реабилитации своей идеи. Он так и не увидел, что был прав в главном.
Как лёд тронулся
Прорыв пришёл туда, где его и ждали, к той самой проблеме обучения многослойных сетей. К середине 1980-х группа исследователей широко описала и популяризировала метод, который позволял распределять работу над ошибками по всем слоям сразу. Идея в том, чтобы пускать сигнал об ошибке в обратную сторону, от ответа к началу, и каждый слой чуть-чуть подправлять. Это и есть знаменитый метод обратного распространения ошибки. Стена, на которую указывала книга, оказалась преодолимой. Просто инструмента под рукой раньше не было.И сети ожили. То, что сегодня узнаёт ваше лицо в телефоне, переводит текст, подсказывает слово при наборе, выросло как раз из тех самых многослойных сетей, которые почти похоронили в конце 1960-х. Книга не врала. Она была математически права. Но честный разбор узкого случая люди приняли за приговор всему направлению.
Что из этого стоит унести с собой
Самое любопытное в этой истории не про машины, а про нас. Авторитетное мнение умеет останавливать прогресс не хуже, чем ошибочное. Книга была точной. А вывод, который из неё сделала среда, оказался поспешным. Целое направление просело на годы не потому, что было тупиковым, а потому, что в нужный момент не нашлось инструмента и не хватило смелости поспорить с большим именем.Сегодня нейросети повсюду, и легко думать, что путь к ним был прямым и неизбежным. Не был. Он шёл через двадцать лет почти полного молчания, через закрытые лаборатории и потерянных энтузиастов. А спусковым крючком стала не злая воля, а аккуратная, честная, всеми уважаемая книга.А вы как считаете: когда одно громкое имя называет идею тупиковой, это чаще спасает нас от пустой траты сил или, наоборот, хоронит что-то стоящее раньше времени?