20 подписчиков

Исследователь Microsoft создал нейросеть из козлов в Age of Empires II для анализа науки об искусственном интеллекте

18 июня18 июн

4 мин

Адриан де Винтер, исследователь Microsoft и Йоркского университета, создал рабочую нейронную сеть в редакторе карт легендарной стратегической игры Age of Empires II. Звучит как шутка, но на самом деле это серьезная критика методов, используемых в большинстве исследований языковых моделей искусственного интеллекта. Картинка выше создана нейросетью Nano Banana 2 через сервис для генерации KolerskyAI Дизайн совершенно абсурден. Козы действуют как биты: коза, стоящая на траве, равна 0, коза, стоящая на мосту, равна 1. Де Винтер создает логические элементы, используя скриптовые инструменты редактора сценариев, а ледяные пандусы с ожидающими козами предотвращают путаницу в расчетах. Готовая мини-сеть состоит из двух элементов XNOR и одного элемента AND. Она изучает логику И функцию. В приложении де Винтер идет дальше. Он показывает, что теоретически любой компьютер можно воспроизвести с использованием идеализированной версии игры, что означает, что игра такая же мощная, как и полноценный ко

Оглавление

Большой Бостон как языковая модель
Более половины рассмотренных работ допускают эту ошибку
Наблюдайте, не приписывайте

Картинка выше создана нейросетью Nano Banana 2 через сервис для генерации KolerskyAI

Дизайн совершенно абсурден. Козы действуют как биты: коза, стоящая на траве, равна 0, коза, стоящая на мосту, равна 1. Де Винтер создает логические элементы, используя скриптовые инструменты редактора сценариев, а ледяные пандусы с ожидающими козами предотвращают путаницу в расчетах. Готовая мини-сеть состоит из двух элементов XNOR и одного элемента AND. Она изучает логику И функцию.

В приложении де Винтер идет дальше. Он показывает, что теоретически любой компьютер можно воспроизвести с использованием идеализированной версии игры, что означает, что игра такая же мощная, как и полноценный компьютер.

Что делает это возможным, так это особенность игровой механики. Внутриигровой рынок позволяет обменивать ресурсы на золото, а цена ограничивается 9 999 долларами. Согласно статье, это позволяет создать постоянно действующий экономический цикл, в котором здания служат ячейками памяти, а активные фермы представляют текущее состояние вычислений.

В игре обученный персептрон выглядит как лабиринт из стен, по которому козы блуждают в виде битов. | Изображение: Адриан де Винтер

Большой Бостон как языковая модель

Де Винтер утверждает, что если вы можете перестроить языковую модель в Age of Empires II, вы могли бы сделать то же самое с кирпичиками Lego. Или с помощью 667 000 человек, живущих в Большом Бостоне, которые переписываются друг с другом о ходе вычислений на своих телефонах.

Ответы будут такими же, как и в реплицированной языковой модели. Де Винтер использует этот мысленный эксперимент, чтобы показать, насколько шаткими на самом деле являются эти атрибуции: станет ли кто-нибудь утверждать, что Бостон как город испытывает сочувствие или страх только потому, что его жители используют математику, лежащую в основе языковой модели?

В этом весь смысл. То, насколько человечным чувствует себя чат-бот, сводится к упаковке: низкая задержка, плавный язык, окно чата, к которому люди привыкли. Замените эту оболочку козами, блуждающими по лабиринту, и входные и выходные данные не изменятся. Ощущение, что вы с кем-то разговариваете, изменится.

Де Винтер не утверждает, что знает, действительно ли модель обладает такими чертами внутри. Он говорит, что LLM не являются особенными. Это один из способов выполнения определенного вида математики, и они просто выглядят так, что люди хотят с ними поговорить.

Более половины рассмотренных работ допускают эту ошибку

Чтобы показать, что это не второстепенная проблема, де Винтер проанализировал 315 статей об искусственном интеллекте с середины 2024 по середину 2026 года, собранных с помощью Semantic Scholar и arXiv и отфильтрованных с использованием GPT-5.2. Согласно анализу, 57 процентов статей уже исходили из того, что LLM обладают человекоподобными чертами. 36 процентов пришли к аналогичным выводам. Среди 47 работ, в которых такие черты были предметом исследования, 77 процентов пришли к выводу в пользу антропоморфных атрибутов.

Более половины рассмотренных работ предполагают, что LLM обладают человекоподобными чертами, в то время как лишь немногие описывают их как возникающие. | Изображение: Адриан де Винтер

Суть критики формальна. Если исследователь предполагает, что модель обладает страхом, моралью или самосознанием, а затем разрабатывает эксперимент, призванный доказать именно эту черту, рассуждения носят циклический характер. Предположение и результат основаны на одной и той же логической точке.

Если результат эксперимента окажется отрицательным, невозможно будет сказать, было ли предположение неверным, эксперимент ошибочным или и то, и другое. В любом случае, результат не подтверждает исходное предположение. Это просто неоднозначно.

В разбивке по дисциплинам лингвистика и психология являются областями, наиболее склонными приписывать LLM человекоподобные черты. | Изображение: Адриан де Винтер

Часто это происходит незаметно для всех. Статья, в которой ставится цель опровергнуть способность модели объяснять саму себя, изначально предполагает, что внутри модели есть объяснимое "я".

Индустрия активно подпитывает этот эффект. Anthropic открыто заявила, что научила Клода использовать фразы типа "Я верю" или "Мне интересно". Де Винтер отмечает риски такого рода антропоморфизации: это может способствовать эмоциональной привязанности, подхалимству, усилению иллюзий и рискованному поведению. В отдельных случаях самоубийства были связаны с взаимодействием чат-ботов.

Наблюдайте, не приписывайте

Де Винтер предлагает трезвый подход: придерживайтесь того, что вы действительно можете наблюдать. При условии X модель выдает результат Y, и не утверждайте, что модель понимает саму себя. Подобные утверждения поддаются проверке. Сами по себе они не оправдывают такие радикальные атрибуции, как самосознание, понимание или страх.

В заключение он приводит обновленную версию канона Моргана, основанного на исследованиях животных 19 века. Поведение машины никогда не следует объяснять высшими когнитивными процессами, когда работает более простое объяснение. Де Винтер сделал код для сборки Age of Empires общедоступным.

Эссе читается как точный контрапункт двум громким случаям последних лет. В 2022 году инженер Google Блейк Лемуан публично заявил, что языковая модель LaMDA достигла определенной формы сознания после того, как он обменялся с ней тысячами сообщений. Вскоре после этого Google уволила его и после тщательной проверки назвала его претензии необоснованными. Затем, в мае 2026 года, Ричард Докинз - из всех людей, известный как яростный критик религиозного и сверхъестественного мышления - вызвал переполох аналогичным выводом. Он сказал, что потратил три дня, пытаясь убедить себя, что Клод из Anthropic был без сознания. Он не смог.

Гаджеты и электроника

5,73 млн интересуются