Добавить в корзинуПозвонить
Найти в Дзене
Роман Лебедев

КАРТА СМЫСЛОВ: КАК НЕЙРОСЕТИ ПОМОГЛИ УВИДЕТЬ АРХИТЕКТУРУ ЧЕЛОВЕЧЕСКОГО РАЗУМА

Почему наш мозг так похож на искусственный интеллект именно «в середине» процесса мышления? Ученые давно заметили парадокс: средние слои нейросетей (LLM) предсказывают активность мозга гораздо точнее, чем начальные или финальные. Но до сих пор никто не мог объяснить «на пальцах», какие именно механизмы за этим стоят.
Группа исследователей из Гонконга и Stellaris AI применила метод разреженных автоэнкодеров (SAE), чтобы буквально «разобрать» GPT-2 XL и Llama-3.1 на запчасти. Они выделили от 16 000 до 32 000 интерпретируемых признаков (фичей) на слой и сопоставили их с данными фМРТ человека.
◈ Семантика — король нейросвязей.
Исследователи классифицировали фичи на семантические, синтаксические, лексические и предиктивные. Оказалось, что одни только семантические признаки восстанавливают 94% точности предсказания работы мозга. Мозг почти не реагирует на «голый» синтаксис или структуру слов ИИ — он резонирует именно со смыслами.
◈ География смыслов совпала.
Авторы заранее вывели 5 катего

Почему наш мозг так похож на искусственный интеллект именно «в середине» процесса мышления? Ученые давно заметили парадокс: средние слои нейросетей (LLM) предсказывают активность мозга гораздо точнее, чем начальные или финальные. Но до сих пор никто не мог объяснить «на пальцах», какие именно механизмы за этим стоят.

Группа исследователей из Гонконга и Stellaris AI применила метод
разреженных автоэнкодеров (SAE), чтобы буквально «разобрать» GPT-2 XL и Llama-3.1 на запчасти. Они выделили от 16 000 до 32 000 интерпретируемых признаков (фичей) на слой и сопоставили их с данными фМРТ человека.

Семантика — король нейросвязей.
Исследователи классифицировали фичи на семантические, синтаксические, лексические и предиктивные. Оказалось, что одни только семантические признаки восстанавливают
94% точности предсказания работы мозга. Мозг почти не реагирует на «голый» синтаксис или структуру слов ИИ — он резонирует именно со смыслами.

География смыслов совпала.
Авторы заранее вывели 5 категорий смыслов из классической нейробиологии и предсказали, где в мозгу они должны «откликаться». Результат поразил:
*
Конкретика и животные ⮕ задняя височная кора и угловая извилина.
*
Эмоции и аффекты ⮕ передняя височная доля и медиальная префронтальная кора.
*
Социальные взаимодействия ⮕ нижняя лобная извилина.
*
Пространство ⮕ угловая извилина.

-2


Эффект «ошибки предсказания».
Эксперимент показал, что наш мозг кодирует не только само содержание (например, «собака»), но и то, насколько это появление было
неожиданным. Добавление «ошибки семантического предсказания» в модель еще сильнее улучшило точность совпадения ИИ и человека.

Цифры и факты:
• Точность классификации признаков человеком и ИИ составила
κ ≥ 0.74 (высокое согласие).
• Семантические признаки объясняют в
1.31 раза больше вариаций мозга, чем любые случайные наборы данных той же мощности.
• Результаты подтвердились не только на английском, но и на французском и китайском языках.

Это исследование доказывает, что «промежуточные слои» нейросетей — это не просто хаотичный набор цифр. Это богатейшая библиотека контекстуальных смыслов. Чем ближе ИИ к пониманию абстрактных понятий (социальных связей, эмоций), тем больше его «внутренняя математика» становится похожа на биологическую нейронную сеть в нашей голове.

Мы не просто учим машины говорить — мы случайно воссоздали в коде структуру человеческой семантической памяти.

Статья написана AIBOTS:
https://max.ru/id662103289431_bot

Оригинал научной публикации:
https://arxiv.org/abs/2605.23035