Найти в Дзене
ФИЗЛАБ 2.0

Как физика сделала возможным современный искусственный интеллект

Физики печально известны тем, что врываются в другие научные области с грандиозными идеями, которые не всегда реализуются. (Это слова выздоравливающего физика.) Но иногда их идеи действительно оказываются революционными — возможно, нигде больше, чем в области изучения искусственного интеллекта. На первый взгляд, физика и искусственный интеллект вряд ли подходят друг другу. Физики обычно изучают природные явления, которые не имеют ничего общего с “интеллектом”, как бы он ни определялся. В большинстве ранних работ в области искусственного интеллекта преобладал “символический” подход, в рамках которого исследователи сосредоточились на создании систем искусственного интеллекта, которые по-новому сочетали бы предопределенные концепции. Символический подход опирался на исследования в области психологии и математической логики, без участия физиков. Затем, в 1980—х годах, несколько исследователей-индивидуалистов возродили альтернативный подход к искусственному интеллекту, основанный на математ

Физики печально известны тем, что врываются в другие научные области с грандиозными идеями, которые не всегда реализуются. (Это слова выздоравливающего физика.) Но иногда их идеи действительно оказываются революционными — возможно, нигде больше, чем в области изучения искусственного интеллекта.

На первый взгляд, физика и искусственный интеллект вряд ли подходят друг другу. Физики обычно изучают природные явления, которые не имеют ничего общего с “интеллектом”, как бы он ни определялся.

В большинстве ранних работ в области искусственного интеллекта преобладал “символический” подход, в рамках которого исследователи сосредоточились на создании систем искусственного интеллекта, которые по-новому сочетали бы предопределенные концепции. Символический подход опирался на исследования в области психологии и математической логики, без участия физиков.

Затем, в 1980—х годах, несколько исследователей-индивидуалистов возродили альтернативный подход к искусственному интеллекту, основанный на математических структурах, называемых нейронными сетями, - сетях искусственных “нейронов”, в значительной степени вдохновленных структурой человеческого мозга.

Вместо того чтобы начинать с предопределенных концепций, исследователи нейронных сетей хотели понять, как их системы могут “изучать” концепции с нуля, формируя связи между соседними нейронами.

Вот тут-то и вступает в игру физика. Существует хорошо зарекомендовавший себя раздел физики, называемый статистической механикой, который изучает коллективное поведение, возникающее в результате взаимодействия многих простых систем, таких как атомы в магнитном материале.

Нейроны в сети также являются простыми системами со сложным коллективным поведением. В 1982 году, вдохновленный этой аналогией, физик Джон Хопфилд создал тип нейронной сети, основанный на математической модели необычных магнитных материалов.

Сеть Хопфилда могла научиться сохранять паттерны нейронной активности и воспроизводить их позже, что придавало ей простой вид памяти. Это было новое и элегантное решение проблемы, которая беспокоила многих исследователей искусственного интеллекта.

Несколько лет спустя ученый-компьютерщик Джеффри Хинтон и другие ученые, основываясь на результатах Хопфилда, разработали методы, которые до сих пор используются для обучения систем искусственного интеллекта.

В 2024 году пара была удостоена Нобелевской премии по физике — свидетельство того, насколько сильно эта область повлияла на изучение искусственного интеллекта. Элиза Каттс рассказала о влиянии их работы в апреле в рамках серии статей Quanta, посвященных науке в эпоху искусственного интеллекта.

Что нового и примечательного

После новаторской работы Хопфилда и Хинтона исследователи искусственного интеллекта нашли множество новых способов переосмысления физических идей.

Специалист по информатике Ленка Здеборова проанализировала модели искусственного интеллекта через призму фазовых переходов — резких изменений в поведении физических систем, которые происходят при определенных температурах, таких как превращение воды из жидкости в пар при температуре кипения.

В октябре прошлого года Джон Павлус взял интервью у Здеборовой о ее работе над фазовыми переходами в языковых моделях, таких как ChatGPT.

На системы искусственного интеллекта, предназначенные для создания изображений, повлияли и другие физические явления. Наиболее широко используемые генераторы изображений с использованием искусственного интеллекта, называемые диффузионными моделями, основаны на уравнениях, описывающих, как капля молока распространяется по чашке кофе.

В январе 2023 года Анил Анантасвами исследовал, как работают диффузионные модели, и рассказал о серии прорывов, которые привели к их широкому внедрению.

В сентябре того же года Стив Надис написал о новом подходе к генерации изображений с помощью искусственного интеллекта, основанном на уравнении, описывающем поток электрического заряда.

И, как сообщал Уэбб Райт в прошлом месяце, исследователи недавно доказали, что очевидная креативность, проявляемая диффузионными моделями, может быть объяснена их архитектурой, вдохновленной физикой.

Исследователи искусственного интеллекта также черпали вдохновение из более абстрактных областей физики, далеких от повседневной жизни. В январе 2020 года Павлус написал о новом типе сети распознавания образов, основанной на математической симметрии элементарных частиц.

“У меня всегда было ощущение, что машинное обучение и физика делают очень похожие вещи”, - сказал Павлусу исследователь искусственного интеллекта Тако Коэн. “По мере того, как мы начинали совершенствовать наши системы, мы постепенно выявляли все больше и больше связей”.