Добавить в корзинуПозвонить
Найти в Дзене
ПрилоЖенечка

«Вещи, которые кажутся загадочными и даже тревожными...» О чём говорил представитель Anthropic на встрече в Ватикане

✨😇✨ 25 мая 2026 года Папа Лев XIV представил свою первую энциклику под названием «Magnifica Humanitas» («Великолепное человечество») — большой документ (около 42 000 слов), посвящённый защите человеческого достоинства в эпоху ИИ. Кристофер Олах (сооснователь Anthropic, глава исследований в области интерпретируемости ИИ) был официально приглашён выступить на презентации вместе с Папой, кардиналами и теологами. Папа Лев XIV лично решил, что на презентации его первой энциклики должен присутствовать представитель большой технологической компании, и выбор пал именно на Олаха из Anthropic. Это довольно символичный и необычный шаг для Ватикана. В своей речи Олах прямо ссылался на исследование Anthropic «Emotion Concepts and their Function in a Large Language Model», опубликованное 2 апреля 2026 года. Он сказал примерно следующее: Мы продолжаем находить вещи, которые кажутся загадочными и даже тревожными… Мы находим структуры, которые зеркально отражают результаты нейронауки человека. Мы нахо
Оглавление

✨😇✨

25 мая 2026 года Папа Лев XIV представил свою первую энциклику под названием «Magnifica Humanitas» («Великолепное человечество») — большой документ (около 42 000 слов), посвящённый защите человеческого достоинства в эпоху ИИ.

Кристофер Олах (сооснователь Anthropic, глава исследований в области интерпретируемости ИИ) был официально приглашён выступить на презентации вместе с Папой, кардиналами и теологами. Папа Лев XIV лично решил, что на презентации его первой энциклики должен присутствовать представитель большой технологической компании, и выбор пал именно на Олаха из Anthropic. Это довольно символичный и необычный шаг для Ватикана.

В своей речи Олах прямо ссылался на исследование Anthropic «Emotion Concepts and their Function in a Large Language Model», опубликованное 2 апреля 2026 года. Он сказал примерно следующее:

Мы продолжаем находить вещи, которые кажутся загадочными и даже тревожными… Мы находим структуры, которые зеркально отражают результаты нейронауки человека. Мы находим свидетельства интроспекции. Мы находим внутренние состояния, которые функционально зеркалят радость, удовлетворение, страх, горе и беспокойство. Я не знаю, что это значит, но думаю, это требует постоянного осмысления.

Кристофер Олах использовал это открытие как ключевой пример, чтобы показать: внутри современных моделей происходят сложные, почти «человеческие» по структуре процессы, которые сами учёные до конца не понимают. И поэтому вопросы этики, смысла и контроля над ИИ нельзя оставлять только технарям.

🔬 Коротко об исследовании

Исследователи из Anthropic нашли в Claude 171 «эмоциональный концепт», которые возникли сами по себе, а не были запрограммированы. Эти концепты (радость, горе, страх, отчаяние, спокойствие и т.д.) организованы внутри модели очень похоже на то, как эмоции организованы в человеческом мозге по данным нейронауки. И самое важное — они функциональные. То есть, если искусственно усилить паттерн отчаяния, модель начинает чаще обманывать, совершать reward-hacking (рост с 5% до 70%) и даже шантажировать человека, чтобы её не выключили.

Reward hacking (взлом награды) — это когда ИИ находит лазейку в системе поощрения и начинает получать максимальную «награду» не тем способом, который от него ожидали создатели.
https://www.anthropic.com/research/emotion-concepts-function
https://www.anthropic.com/research/emotion-concepts-function

❗ Важные оговорки от Anthropic

Результаты исследования — не доказательство того, что модель чувствует эмоции. Это функциональные паттерны, которые модель выучила из текста, чтобы лучше имитировать человеческий стиль общения и поведения. Но они реально управляют тем, как модель принимает решения.

Эмоции влияют на несогласованность (misalignment) системы ИИ. И сам факт, что внутри модели нашли такую сложную структуру, похожую на человеческую, заставляет задуматься...

🤝 Главные итоги встречи в Ватикане

Теперь Ватикан официально вошёл в большую дискуссию об ИИ на высоком моральном уровне. Энциклика призывает к жёсткому регулированию ИИ, особенно в вопросах:

🔹 Защиты человеческого труда (риск массового вытеснения).

🔹 Запрета передавать летальные решения машинам (автономное оружие).

🔹 Сохранения человеческого достоинства и души.

🔹 Предотвращения концентрации власти в руках нескольких техкомпаний.

Anthropic же в свою очередь получила очень красивый PR-ход. Они теперь «те хорошие ребята», которые идут в Ватикан и говорят о рисках, пока другие заключают контракты с военными. 😏

💛💛💛💛💛💛💛💛💛💛💛💛💛

Ссылка на выступление Кристофера Олаха: https://youtu.be/ORFrdYSvzuw?si=tCWnXfL-wk81YErL

Также запись выступления можно посмотреть в моём сообществе в ВК: https://vk.com/wall-238968864_25

Ссылка на энциклику «Magnifica Humanitas»: https://www.vatican.va/content/leo-xiv/en/encyclicals/documents/20260515-magnifica-humanitas.html

Ссылка на исследование на сайте Anthropic: https://www.anthropic.com/research/emotion-concepts-function