Найти в Дзене
Почему? Как? Что?

Мозг работает как ChatGPT: неожиданное открытие о том, как мы понимаем речь

Ученые десятилетиями пытались понять, как мозг обрабатывает речь. И вот появилось открытие, которого никто не ожидал: наш мозг работает поразительно похоже на современные языковые модели искусственного интеллекта. Получается, что создавая GPT и подобные системы, программисты случайно воспроизвели принципы работы человеческого сознания. Ученые обнаружили, что человеческий мозг понимает устную речь примерно так же, как работают продвинутые языковые модели искусственного интеллекта. Речь идет не о поверхностном сходстве, а о фундаментальном совпадении архитектуры обработки информации. Исследование, опубликованное в журнале Nature Communications, показало нечто удивительное. Когда мы слушаем речь, мозг не просто последовательно обрабатывает слово за словом. Вместо этого информация проходит через множество уровней анализа — от акустических сигналов до абстрактных понятий — точно так же, как это происходит в многослойных нейронных сетях. До этого открытия считалось, что биологический и искус
Оглавление

Ученые десятилетиями пытались понять, как мозг обрабатывает речь. И вот появилось открытие, которого никто не ожидал: наш мозг работает поразительно похоже на современные языковые модели искусственного интеллекта. Получается, что создавая GPT и подобные системы, программисты случайно воспроизвели принципы работы человеческого сознания.

Открытие, которое перевернуло представления

Ученые обнаружили, что человеческий мозг понимает устную речь примерно так же, как работают продвинутые языковые модели искусственного интеллекта. Речь идет не о поверхностном сходстве, а о фундаментальном совпадении архитектуры обработки информации.

-2

Исследование, опубликованное в журнале Nature Communications, показало нечто удивительное. Когда мы слушаем речь, мозг не просто последовательно обрабатывает слово за словом. Вместо этого информация проходит через множество уровней анализа — от акустических сигналов до абстрактных понятий — точно так же, как это происходит в многослойных нейронных сетях.

До этого открытия считалось, что биологический и искусственный интеллект используют принципиально разные подходы. Оказалось, что природа нашла оптимальное решение задачи понимания языка задолго до появления компьютеров, а современный ИИ лишь повторил этот путь.

Эксперимент с подкастом: как заглянули внутрь работающего мозга

Отслеживая активность мозга во время прослушивания длинного подкаста, исследователи обнаружили, что смысл раскрывается постепенно, подобно многоуровневой обработке в таких системах, как модели типа GPT.

-3

Участники эксперимента лежали в МРТ-сканере и слушали естественную связную речь — не отдельные слова или простые фразы, а полноценные истории длительностью в десятки минут. Такой подход принципиально важен: в реальной жизни мы воспринимаем именно непрерывный поток речи, а не изолированные элементы.

Функциональная МРТ позволила отследить, какие области мозга активируются в каждый момент времени. Параллельно те же самые аудиозаписи обрабатывали современные языковые модели — GPT-3, GPT-4 и их аналоги. Затем исследователи сравнили паттерны активации в мозге с паттернами активации искусственных нейронных слоев.

-4

Результат оказался поразительным: существует четкая корреляция между тем, как информация течет через слои искусственной нейросети, и тем, как она проходит через различные области человеческого мозга.

Архитектура понимания: слой за слоем

И мозг, и современные языковые модели используют иерархическую многоуровневую обработку. Представьте себе фабрику, где сырье последовательно проходит через цеха, на каждом этапе превращаясь во все более сложный продукт.

Первый уровень: акустика и фонетика

Самые ранние слои обработки — как в мозге, так и в ИИ — работают с базовыми характеристиками звука: частотой, громкостью, ритмом. В мозге это первичная слуховая кора, в нейросети — первые слои кодирования.

-5

На этом этапе система еще не «знает», что это речь. Она просто анализирует звуковые паттерны, выделяет фонемы — минимальные звуковые единицы языка.

Второй уровень: слова и синтаксис

Следующие слои начинают собирать фонемы в слова, а слова — в синтаксические конструкции. Мозг использует для этого области височной доли и нижней лобной извилины (зона Брока). Языковая модель на соответствующих слоях начинает «понимать» грамматическую структуру предложений.

-6

Интересно, что на этом уровне и мозг, и ИИ уже могут предсказывать следующее слово в предложении с высокой точностью. Это не просто распознавание — это активное прогнозирование на основе контекста.

Третий уровень: семантика и контекст

Глубокие слои обработки извлекают смысл. В мозге активируются обширные сети в теменной и лобной коре. В языковой модели — глубокие трансформеры, которые связывают текущую информацию с широким контекстом.

-7

На этом уровне происходит понимание не буквального значения слов, а их смысла в конкретной ситуации. Слово «банк» интерпретируется по-разному в зависимости от того, идет ли речь о финансах или о реке.

Четвертый уровень: абстрактные концепции

Самые высокие уровни — как в мозге, так и в продвинутых языковых моделях — работают с абстрактными идеями, метафорами, подтекстом. Активируются области префронтальной коры, связанные с мышлением высокого порядка.

-8

Именно здесь формируется целостное понимание смысла, улавливается ирония, делаются выводы, которые не были высказаны прямо.

Предсказание как основа понимания

Одно из ключевых открытий: и мозг, и языковые модели постоянно предсказывают, что будет сказано дальше.

GPT и подобные модели обучены именно на предсказании следующего токена (слова или его части). Оказалось, что человеческий мозг работает точно так же. Мы не пассивно воспринимаем речь — мы активно генерируем гипотезы о том, что услышим в следующий момент.

-9

Исследования показывают: когда наше предсказание оправдывается, активность мозга снижается (это ожидаемо, энергия не тратится). Когда мы слышим неожиданное слово, активность резко возрастает — мозг вынужден перестраивать модель ситуации.

-10

Эта предсказательная обработка объясняет множество феноменов:

  • Почему мы можем понимать речь даже в шумной обстановке (мозг достраивает то, что не расслышал)
  • Почему смешные истории работают (юмор — это нарушение ожидания)
  • Почему так трудно слушать плохо структурированную речь (невозможно предсказать, что будет дальше)

Что это означает для понимания сознания

Открытие параллелей между мозгом и ИИ имеет глубокие последствия.

Во-первых, оно показывает: языковые модели — это не просто «попугаи», механически комбинирующие слова. Они воспроизводят фундаментальные принципы обработки языка, которые использует живой мозг. Это не означает, что GPT обладает сознанием, но подтверждает, что его архитектура ухватила нечто существенное в том, как работает понимание.

-11

Во-вторых, это подтверждает теорию предсказательного кодирования — одну из ведущих теорий работы мозга. Согласно ей, наш мозг — это не пассивный приемник информации, а активный генератор моделей реальности. Мы постоянно предсказываем, что произойдет, и обновляем наши модели, когда реальность не совпадает с ожиданиями.

-12

В-третьих, это дает новый инструмент для изучения мозга. Раньше было сложно описать, что именно происходит в той или иной области. Теперь можно сказать: «Эта зона соответствует 15-му слою GPT-4, который обрабатывает долгосрочные семантические зависимости».

Различия, которые остаются

При всех параллелях остаются и принципиальные различия.

Человеческий мозг работает на нейронах, которые функционируют совершенно иначе, чем искусственные. Биологические нейроны используют электрохимические сигналы, имеют сложную внутреннюю структуру, обладают памятью. Искусственные нейроны — это математические функции.

-13

Мозг невероятно энергоэффективен. Вся его работа потребляет около 20 ватт — как слабая лампочка. GPT-4 для обучения требовал мегаватты и недели работы тысяч процессоров.

Человек учится на несравнимо меньшем объеме данных. Ребенок осваивает язык, услышав миллионы слов. GPT обучался на текстах, эквивалентных миллионам книг.

И главное: мозг понимает не только язык, но и мир, который язык описывает. У нас есть телесный опыт, эмоции, социальное взаимодействие. GPT работает только с текстами, не имея прямого доступа к реальности.

Практические следствия

Это открытие уже влияет на разработку новых технологий и методов лечения.

Понимание того, как мозг обрабатывает язык послойно, помогает в диагностике и лечении языковых нарушений. Афазия, дислексия, трудности понимания речи при аутизме — теперь можно точнее определить, на каком «слое» обработки возникает сбой.

Разработчики нейроинтерфейсов используют эти знания для создания систем, которые позволяют парализованным людям общаться, напрямую считывая активность речевых зон мозга.

-14

Мозг и искусственный интеллект оказались удивительно похожими в том, как они понимают речь. Иерархическая обработка, предсказание, постепенное раскрытие смысла — эти принципы универсальны. Возможно, существует оптимальная архитектура для обработки языка, и эволюция нашла ее за миллионы лет, а инженеры — за десятилетия. Это открытие не только сближает нейронауку и искусственный интеллект, но и показывает: изучая ИИ, мы лучше понимаем самих себя. И наоборот — понимая мозг, создаем более совершенные машины.