Найти в Дзене

Краткая история развития AI (ИИ): от мифов к реальности

Идея создания мыслящих машин и искусственных существ уходит корнями в глубокую древность, встречаясь в мифах и легендах. Но путь от этих мечтаний к реальным чат-ботам, беспилотным автомобилям и системам рекомендаций был долгим и извилистым. Давайте проследим за ключевыми вехами в истории развития ИИ. Теоретической основой для будущего ИИ стали работы математиков, таких как Алан Тьюринг, который в 1950 году в своей статье «Вычислительные машины и разум» задал вопрос: «Могут ли машины думать?» и предложил знаменитый "тест Тьюринга" — эмпирический критерий интеллекта машины. В это же время появились первые нейросети и кибернетика. В 1943 году Уоррен Маккаллок и Уолтер Питтс создали простейшую математическую модель нейрона, а в 1949 году Дональд Хебб предложил правило обучения для нейронных сетей. Официальной датой рождения искусственного интеллекта как научной дисциплины принято считать 1956 год. Тогда группа ученых, включая Джона Маккарти, Марвина Мински, Клода Шеннона и Натаниэля Рочест
Оглавление

Идея создания мыслящих машин и искусственных существ уходит корнями в глубокую древность, встречаясь в мифах и легендах. Но путь от этих мечтаний к реальным чат-ботам, беспилотным автомобилям и системам рекомендаций был долгим и извилистым. Давайте проследим за ключевыми вехами в истории развития ИИ.

Временная шкала развития AI.
Временная шкала развития AI.

Истоки и рождение (1940-1950-е)

Теоретической основой для будущего ИИ стали работы математиков, таких как Алан Тьюринг, который в 1950 году в своей статье «Вычислительные машины и разум» задал вопрос: «Могут ли машины думать?» и предложил знаменитый "тест Тьюринга" — эмпирический критерий интеллекта машины.

Алан Тьюринг - британский математик, логик и криптограф, оказавший существенное влияние на развитие информатики. Офицер ордена Британской империи (OBE, 1945), член Лондонского королевского общества.
Алан Тьюринг - британский математик, логик и криптограф, оказавший существенное влияние на развитие информатики. Офицер ордена Британской империи (OBE, 1945), член Лондонского королевского общества.

В это же время появились первые нейросети и кибернетика. В 1943 году Уоррен Маккаллок и Уолтер Питтс создали простейшую математическую модель нейрона, а в 1949 году Дональд Хебб предложил правило обучения для нейронных сетей.

Официальной датой рождения искусственного интеллекта как научной дисциплины принято считать 1956 год. Тогда группа ученых, включая Джона Маккарти, Марвина Мински, Клода Шеннона и Натаниэля Рочестера, организовала в Дартмутском колледже двухмесячный воркшоп. Именно Маккарти впервые предложил термин «Искусственный Интеллект» (Artificial Intelligence).

Организаторы семинара - Джон Маккарти, Марвин Мински, Клод Шеннон и Натаниэль Рочестер (англ. Nathaniel Rochester), ими приглашены семь крупных американских учёных, так или иначе связанных с вопросами теории управления, теории автоматов, нейронных сетей, теории игр и исследованием интеллекта: Артур Самюэль (IBM), Аллен Ньюэлл, Герберт Саймон (оба — Университет Карнеги — Меллона), Тренчард Мур, (Принстонский университет), Рэй Соломонов (англ. Ray Solomonoff) и Оливер Селфридж (оба — Массачусетский технологический институт).
Организаторы семинара - Джон Маккарти, Марвин Мински, Клод Шеннон и Натаниэль Рочестер (англ. Nathaniel Rochester), ими приглашены семь крупных американских учёных, так или иначе связанных с вопросами теории управления, теории автоматов, нейронных сетей, теории игр и исследованием интеллекта: Артур Самюэль (IBM), Аллен Ньюэлл, Герберт Саймон (оба — Университет Карнеги — Меллона), Тренчард Мур, (Принстонский университет), Рэй Соломонов (англ. Ray Solomonoff) и Оливер Селфридж (оба — Массачусетский технологический институт).

Первые шаги и «Золотая эра» (1950 – 1960-е)

Эти годы были наполнены энтузиазмом. Казалось, что человеческий интеллект вот-вот будет воссоздан в машине. Появились первые программы, демонстрирующие элементы интеллекта:

  • Logic Theorist (1956): программа, способная доказывать математические теоремы.
Logic Theorist была использована на компьютере JOHNNIAC (ранний компьютер, построенный в 1953 году корпорацией RAND Corporation) в головном офисе RAND в Санта-Монике.
Logic Theorist была использована на компьютере JOHNNIAC (ранний компьютер, построенный в 1953 году корпорацией RAND Corporation) в головном офисе RAND в Санта-Монике.
  • General Problem Solver (1957): программа, решавшая головоломки и формализованные задачи.
Универсальный решатель задач (англ. General Problem Solver, GPS) — компьютерная программа, созданная в 1957 году Гербертом Саймоном, Клиффордом Шоу (англ. Cliff Show) и Алленом Ньюэллом, предназначенная для работы в качестве универсальной машины для решения задач, сформулированных на языке хорновских дизъюнктов. В качестве примеров использования приводились доказательства теорем евклидовой геометрии и логики предикатов, решение шахматных задач.
Программа основана на теоретической работе Саймона и Ньюэлла о логических машинах. Считается первой компьютерной программой, в которой предпринята стратегия разделения знаний о задачах (правила, которые подавались на вход программы) от стратегии решения задач (общий решающий движок). Решающий алгоритм был реализован на низкоуровневом языке программирования IPL.
Универсальный решатель задач (англ. General Problem Solver, GPS) — компьютерная программа, созданная в 1957 году Гербертом Саймоном, Клиффордом Шоу (англ. Cliff Show) и Алленом Ньюэллом, предназначенная для работы в качестве универсальной машины для решения задач, сформулированных на языке хорновских дизъюнктов. В качестве примеров использования приводились доказательства теорем евклидовой геометрии и логики предикатов, решение шахматных задач. Программа основана на теоретической работе Саймона и Ньюэлла о логических машинах. Считается первой компьютерной программой, в которой предпринята стратегия разделения знаний о задачах (правила, которые подавались на вход программы) от стратегии решения задач (общий решающий движок). Решающий алгоритм был реализован на низкоуровневом языке программирования IPL.
  • ELIZA (1966): первый чат-бот, созданный Джозефом Вейценбаумом, который пародировал диалог с психотерапевтом.
Элиза (англ. ELIZA) — компьютерная программа виртуального собеседника, созданая в 1960-х Джозефом Вейценбаумом. ELIZA — первая в истории компьютерных наук программа, общающаяся с человеком на естественном языке.
Элиза (англ. ELIZA) — компьютерная программа виртуального собеседника, созданая в 1960-х Джозефом Вейценбаумом. ELIZA — первая в истории компьютерных наук программа, общающаяся с человеком на естественном языке.

Ученые предсказывали, что через 20-30 лет появятся машины, превосходящие человека в интеллектуальном плане.

Первая «Зима ИИ» (1970-е)

Обещания не сбылись. Исследователи столкнулись с непреодолимыми на тот момент трудностями:

  • Ограниченная вычислительная мощность. Компьютеры были слишком слабыми для сложных вычислений.
  • Сложность формализации знаний. Оказалось, что «здравый смысл» и повседневные знания человека практически невозможно перевести в алгоритмы.
  • Критика и скептицизм. В 1969 году Марвин Мински и Сеймур Паперт показали фундаментальные ограничения перцептронов (простейших нейросетей), что надолго охладило интерес к этому направлению.
Перцептро́н (англ. perceptron от лат. perceptio — восприятие; нем. Perzeptron) — математическая или компьютерная модель восприятия информации мозгом (кибернетическая модель мозга), предложенная Фрэнком Розенблаттом в 1957 году и впервые воплощённая в виде электронной машины «Марк-1» в 1960 году. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером.
Перцептро́н (англ. perceptron от лат. perceptio — восприятие; нем. Perzeptron) — математическая или компьютерная модель восприятия информации мозгом (кибернетическая модель мозга), предложенная Фрэнком Розенблаттом в 1957 году и впервые воплощённая в виде электронной машины «Марк-1» в 1960 году. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером.

Финансирование резко сократилось, и наступила первая «зима ИИ» — период разочарования и снижения интереса к области.

Эра экспертных систем (1980-е годы)

Чтобы выйти из кризиса, фокус сместился с создания общего интеллекта на решение узкоспециализированных задач. На сцену вышли экспертные системы — программы, которые имитировали экспертов в конкретной области (например, медицине или геологии).

  • Пример: Система MYCIN помогала диагностировать инфекционные заболевания и назначать антибиотики.
MYCIN оперировала с помощью довольно простой машины вывода, и базы знаний из ~600 правил. После запуска, программа задавала пользователю (врачу) длинный ряд простых «да/нет» или текстовых вопросов. В результате, система предоставляла список подозреваемых бактерий, отсортированный по вероятности, указывала доверительный интервал для вероятностей диагнозов и их обоснование (то есть MYCIN предоставляла список вопросов и правил, которые привели её к именно такому ранжированию диагнозов), а также рекомендовала курс лечения.
MYCIN оперировала с помощью довольно простой машины вывода, и базы знаний из ~600 правил. После запуска, программа задавала пользователю (врачу) длинный ряд простых «да/нет» или текстовых вопросов. В результате, система предоставляла список подозреваемых бактерий, отсортированный по вероятности, указывала доверительный интервал для вероятностей диагнозов и их обоснование (то есть MYCIN предоставляла список вопросов и правил, которые привели её к именно такому ранжированию диагнозов), а также рекомендовала курс лечения.

Экспертные системы стали коммерчески успешными, и интерес к ИИ снова возродился. Однако у них был свой недостаток: их было крайне сложно и дорого поддерживать и обновлять. К концу 1980-х рынок снова рухнул, начав вторую «зиму ИИ».

Возрождение и победа статистических методов (1990-е – 2000-е)

«Зима» закончилась благодаря смене парадигмы. Вместо попыток смоделировать человеческое мышление ученые сделали ставку на машинное обучение — идею о том, что компьютеры могут учиться на данных, не будучи явно запрограммированными на каждое действие.

Ключевые события:

  • В 1997 году суперкомпьютер Deep Blue от IBM обыграл чемпиона мира по шахматам Гарри Каспарова. Это был символический прорыв.
Суперкомпьютер Deep Blue от IBM обыграл чемпиона мира по шахматам Гарри Каспарова в двух матчах по шесть партий
Суперкомпьютер Deep Blue от IBM обыграл чемпиона мира по шахматам Гарри Каспарова в двух матчах по шесть партий
  • Алгоритмы, основанные на статистике и теории вероятностей, стали применяться для решения реальных задач: фильтрации спама, прогнозирования, рекомендательных систем.
Принципиальная схема системы фильтрации спама.
Принципиальная схема системы фильтрации спама.

Глубокое обучение и современный бум (2010-е – настоящее время)

Современная революция в ИИ связана с глубоким обучением — видом машинного обучения на основе многослойных нейронных сетей. Этому способствовали три фактора:

  • Большие данные. Появление интернета и цифровизация предоставили огромные объемы информации для обучения.
  • Мощное железо. Развитие графических процессоров (GPU) дало необходимую вычислительную мощность.
  • Улучшенные алгоритмы. Были разработаны новые, более эффективные архитектуры нейросетей.

Яркие примеры прорывов:

  • 2012: Модель AlexNet с большим отрывом выиграла конкурс распознавания изображений ImageNet, показав превосходство глубоких нейросетей.
  • 2016: Система AlphaGo от DeepMind победила чемпиона мира в сложнейшей игре Го, что считалось невозможным еще за 10 лет до этого.
  • 2018 – н.в.: Появление больших языковых моделей (LLM), таких как GPT от OpenAI, которые генерируют связные тексты, переводят и отвечают на вопросы.
Для обучения нейронной сети необходимы репрезентативные данные, включающие примеры и соответствующие выходные значения. Этот процесс контролируемый, где «учитель» предоставляет входные данные и ожидаемые результаты. После многократного предъявления данных веса сети стабилизируются, и она начинает корректно отвечать на большинство примеров. В таких случаях говорят, что сеть обучена.
Для обучения нейронной сети необходимы репрезентативные данные, включающие примеры и соответствующие выходные значения. Этот процесс контролируемый, где «учитель» предоставляет входные данные и ожидаемые результаты. После многократного предъявления данных веса сети стабилизируются, и она начинает корректно отвечать на большинство примеров. В таких случаях говорят, что сеть обучена.

Что дальше?

Сегодня ИИ интегрирован в повседневную жизнь: от голосовых помощников и умных лент в соцсетях до систем диагностики рака и разработки новых материалов. Основные вызовы современности — это не технические ограничения, а этические вопросы: предвзятость алгоритмов, конфиденциальность данных, влияние на рынок труда и создание безопасного и управляемого ИИ.

История ИИ — это история взлетов и падений, но тренд очевиден: от мифов к инструменту, а от инструмента — к партнеру, способному коренным образом изменить нашу цивилизацию.