Добавить в корзинуПозвонить
Найти в Дзене
XX2 ВЕК

Дофаминовые часы: как ваш мозг предсказывает, когда вам будет хорошо

Скрестив ИИ с неврологией, группа исследователей из Университетов Женевы, Гарварда и Макгилла обнаружила вычислительный потенциал области мозга, отвечающей за мотивацию. Вентральная тегментальная область, располагающаяся в глубине мозга, не только сигнализирует о том, когда мы получаем удовольствие, она прогнозирует, когда именно мы его получим. Это открытие было сделано благодаря элегантному сотрудничеству между неврологами и исследователями ИИ, показав, что нейроны не только прогнозируют вероятность получения удовольствия в будущем, но и точное время этого события. Небольшая область мозга, известная как вентральная тегментальная область (ВТО), играет ключевую роль в том, как мы обрабатываем информацию об удовольствии. Она вырабатывает дофамин, нейропептид, помогающий спрогнозировать удовольствие в будущем, основываясь на контекстных подсказках. Группа из университетов Женевы, Гарварда и Макгилла показала, что ВТО способна на большее: она не только кодирует ожидаемое удовольствие, но
Оглавление
© Adobe Stock
© Adobe Stock

Скрестив ИИ с неврологией, группа исследователей из Университетов Женевы, Гарварда и Макгилла обнаружила вычислительный потенциал области мозга, отвечающей за мотивацию.

Вентральная тегментальная область, располагающаяся в глубине мозга, не только сигнализирует о том, когда мы получаем удовольствие, она прогнозирует, когда именно мы его получим. Это открытие было сделано благодаря элегантному сотрудничеству между неврологами и исследователями ИИ, показав, что нейроны не только прогнозируют вероятность получения удовольствия в будущем, но и точное время этого события.

Небольшая область мозга, известная как вентральная тегментальная область (ВТО), играет ключевую роль в том, как мы обрабатываем информацию об удовольствии. Она вырабатывает дофамин, нейропептид, помогающий спрогнозировать удовольствие в будущем, основываясь на контекстных подсказках. Группа из университетов Женевы, Гарварда и Макгилла показала, что ВТО способна на большее: она не только кодирует ожидаемое удовольствие, но также и конкретный момент, когда оно будет получено. Это открытие, ставшее возможным благодаря алгоритму машинного обучения, подчёркивает ценность сочетания ИИ с неврологией. Исследование опубликовано в журнале Nature.

Вентральная тегментальная область (ВТО) играет ключевую роль в мотивации и контуре мозга, отвечающем за удовольствие. Будучи основным источником дофамина, этот небольшой конгломерат нейронов посылает этот нейропептид в другие области мозга, чтобы запустить активность в ответ на положительный стимул.

«Изначально ВТО считали просто центром удовольствия в мозге. Но в 1990-е учёные обнаружили, что она кодирует не само удовольствие, а, скорее, прогноз удовольствия», — объясняет Александр Пуже, профессор департамента основных неврологических наук на факультете медицины Женевского университета.

Эксперименты на животных показали, что, когда вознаграждение постоянно дают после, допустим, светового сигнала, ВТО в итоге высвобождает дофамин не в момент получения вознаграждения, а в момент появления сигнала. Таким образом, эта реакция кодирует прогноз вознаграждения, связанный с сигналом, в не само вознаграждение.

Более сложная функция

Такое «стимулирующее обучение», требующее минимального надзора — основа обучения человека. Также этот принцип лежит в основе многих алгоритмов искусственного интеллекта, которые повышают производительность благодаря обучению, вроде AlphaGo — первого алгоритма, победившего чемпиона мира по игре в го.

В недавнем исследовании группа Александра Пуже в сотрудничестве с Наосиге Учида из Гарвардского университета и Пола Массета из Университета Макгилла показала, что кодирование ВТО ещё замысловатее, чем считалось ранее. «Вместо прогнозирования взвешенной суммы будущего вознаграждения, ВТО прогнозирует их развитие во времени. Иными словами, каждая награда представлена в отдельности, с указанием конкретного времени её получения», — объясняет учёный из Женевского университета, руководивший этой работой.

«Хотя мы знали, что нейроны ВТО ставят в приоритет награды, находящиеся ближе по времени, чем более отдалённые в будущем, по принципу синицы в руке и журавля в небе, мы обнаружили, что различные нейроны делают это в различных временных масштабах, где одни сконцентрированы на награде, возможной в течение нескольких секунд, другие — на минутной дистанции, а третьи — в более отдалённом времени. Именно это разнообразие позволяет кодировать время получения награды. Это более тонкое представление придаёт системе обучения большую гибкость, позволяя ей адаптироваться, чтобы максимизировать сиюминутные или отложенные вознаграждения, в зависимости от целей и приоритетов индивида».

ИИ и неврология — улица с двусторонним движением

Это открытие стало возможным благодаря плодотворному диалогу между неврологией и искусственным интеллектом. Александр Пуже разработал чисто математический алгоритм, включающий в себя обработку информации о времени получения награды. Тем временем, исследователи из Гарварда собрали обширные нейрофизиологические данные по активности ВТО у животных, получающих вознаграждение.

«Затем они применили алгоритм к своим данным и обнаружили, что результаты абсолютно совпадали с их эмпирическими выкладками». Хотя мозг инспирирует методы ИИ и машинного обучения, эти результаты демонстрируют, что алгоритмы также способны служить в качестве мощных инструментов для открытия наших нейрофизиологических механизмов.

Перевод — Андрей Прокипчук, «XX2 ВЕК». Источники.

Материалы предоставлены Университетом Женевы (Université de Genève).

Вам также может быть интересно: