Добавить в корзинуПозвонить
Найти в Дзене
Нейросети уже здесь

Как один конкурс по распознаванию картинок в 2012-м перевернул всю историю ИИ

Представьте: учёные десятилетиями бились над тем, чтобы научить компьютер просто отличать кошку от собаки на фотографии. Для человека — секундное дело, даже трёхлетний ребёнок справится. А машина буксовала. И вот в 2012 году произошло событие, после которого всё пошло другим путём. Без громких заголовков в новостях, без сенсаций на телевидении. Просто результаты одного научного соревнования, на которые тогда обратили внимание разве что специалисты. А сегодня именно этот год историки технологий называют точкой, с которой начался весь нынешний бум вокруг искусственного интеллекта. Был такой ежегодный конкурс — ImageNet. Суть простая: организаторы собрали гигантскую коллекцию фотографий, больше миллиона картинок, разложенных по тысяче категорий. Вот эти — собаки, вот эти — грибы, вот эти — корабли, самолёты, чашки, виноград. А дальше команды со всего мира соревновались: чья программа точнее угадает, что изображено на новых, незнакомых ей снимках. Своего рода олимпиада по зрению для компью
Оглавление

Представьте: учёные десятилетиями бились над тем, чтобы научить компьютер просто отличать кошку от собаки на фотографии. Для человека — секундное дело, даже трёхлетний ребёнок справится. А машина буксовала. И вот в 2012 году произошло событие, после которого всё пошло другим путём. Без громких заголовков в новостях, без сенсаций на телевидении. Просто результаты одного научного соревнования, на которые тогда обратили внимание разве что специалисты. А сегодня именно этот год историки технологий называют точкой, с которой начался весь нынешний бум вокруг искусственного интеллекта.

Конкурс, где машины соревновались в зоркости

Был такой ежегодный конкурс — ImageNet. Суть простая: организаторы собрали гигантскую коллекцию фотографий, больше миллиона картинок, разложенных по тысяче категорий. Вот эти — собаки, вот эти — грибы, вот эти — корабли, самолёты, чашки, виноград. А дальше команды со всего мира соревновались: чья программа точнее угадает, что изображено на новых, незнакомых ей снимках. Своего рода олимпиада по зрению для компьютеров. Годами участники подбирались к задаче примерно одинаково и ошибались примерно одинаково часто — около четверти всех картинок программы распознавали неправильно. Прогресс шёл, но по чуть-чуть, по доле процента в год. Все вежливо боролись за эти крохи. А потом пришла команда из Торонто и одним рывком обогнала всех с разгромным отрывом. Их программа под названием AlexNet ошибалась почти вдвое реже ближайших соперников. Для тихого академического конкурса это был не шаг вперёд, а прыжок через пропасть. В зале, как потом вспоминали участники, повисла тишина — все поняли, что старые подходы только что устарели.

Идея была не новой — новым было то, что её наконец-то стало чем кормить

И вот тут самое интересное. Те, кто победил, не изобрели какую-то невиданную магию. В основе их работы лежали нейросети — подход, который пытается грубо подражать тому, как устроены связи между клетками в человеческом мозге. Так вот, идее этой к 2012 году было уже несколько десятилетий. О ней знали, её обсуждали, но она годами считалась тупиковой и почти заброшенной. Большинство серьёзных исследователей махнули на неё рукой: красивая теория, а на практике толку нет. Почему же то, что не работало двадцать лет, вдруг сработало? Сошлись вместе три вещи, которых раньше поодиночке было недостаточно. И именно их совпадение, а не гениальное озарение одного человека, и стало настоящим переломом.

Первое: появились горы данных

Нейросеть похожа на ребёнка, который учится узнавать мир на примерах. Покажите малышу одну кошку — он запутается. Покажите тысячу разных кошек — рыжих, чёрных, спящих, бегущих — и он начнёт улавливать суть. Машине нужно то же самое, только примеров ей требуется не тысячи, а миллионы. И раньше взять их было просто негде. А к началу 2010-х человечество уже несколько лет жило в интернете, забитом фотографиями: люди выкладывали снимки в социальные сети, подписывали их, делились ими. Тот самый конкурс ImageNet как раз и стал возможен потому, что нашлось из чего собрать его громадную коллекцию размеченных картинок. Появился корм, которого этому вечно голодному подходу не хватало все предыдущие годы.

Второе: на помощь пришли видеокарты

Чтобы переварить такие объёмы, нужна чудовищная вычислительная мощь. Обычный процессор компьютера тут как один очень умный работник: задачи он решает блестяще, но строго по очереди, одну за другой. А обучение нейросети — это миллиарды однообразных простеньких вычислений, которые удобнее делать не подряд, а все сразу. И вот оказалось, что для этого идеально подходят видеокарты — те самые, что создавались для компьютерных игр, чтобы рисовать тысячи пикселей одновременно. Видеокарта — это уже не один гений, а целая толпа работников попроще, которые навалятся на гору одинаковых задач разом. Команда-победитель как раз и догадалась запрячь обычные игровые видеокарты для обучения своей программы. То, на что раньше ушли бы месяцы, стало занимать дни. Железо, придуманное ради красивых взрывов в играх, неожиданно открыло дорогу к искусственному интеллекту.

Третье: нашлись люди, которые в это верили

А ещё нужны были упрямцы. Те самые исследователи, что не бросили заброшенную идею, пока все остальные над ней посмеивались. Они годами продолжали возиться с нейросетями, дорабатывали приёмы обучения, искали, что мешает им заработать в полную силу. И когда наконец подоспели и данные, и подходящее железо, у них уже было готово, чем эти ресурсы загрузить. Перелом случился на стыке: давно вызревшая идея встретилась с интернетом, набитым картинками, и с дешёвой вычислительной мощью из игровой индустрии. Убери любую из этих трёх опор — и никакого 2012 года в истории ИИ просто не было бы.

Почему этот тихий год дотянулся до вашего телефона

После того конкурса всё посыпалось лавиной. Крупные компании быстро смекнули, к чему дело идёт, и принялись переманивать к себе тех самых исследователей и вкладывать огромные деньги в этот подход. Дальше за несколько лет нейросети научились не только разбирать картинки, но и распознавать речь, переводить тексты, советовать вам фильмы, а в итоге — и поддерживать разговор. Всё то, чем вы пользуетесь сегодня: голосовой помощник в телефоне, автоматический перевод вывески через камеру, умные подсказки в поиске, чат-боты, которые отвечают почти как живые, — всё это растёт из той самой развилки. В 2012-м мир не заметил, что свернул на новую дорогу. А свернул. И едем мы по ней до сих пор. Скажите честно: вы догадывались, что вся нынешняя история с ИИ началась не с робота и не с громкой сенсации, а с обычного конкурса по разглядыванию фотографий?