Нейросети начинают «осознавать» свои мысли Мы вопсринимаем ИИ как черный ящик - дали задачу, он внутри непонятно что сделал и выдал нам ответ – магия! Но команда Anthropic задалась фундаментальным вопросом: может ли модель сама отследить, что происходит у неё в «голове»? Тестировали новые модельки Claude Opus 4 и 4.1, искали у ИИ признаки интроспекции — способности анализировать собственные внутренние состояния. Было три эксперимента: 🟢Эксперимент «Начало» (Inception). Нашли нейронный паттерн (вектор), отвечающий за конкретную концепцию, например, «КРИК/КАПСЛОК». Затем они искусственно внедрили этот паттерн в модель, пока она решала другую задачу. (если говорит человеческим языком, то они нашли где в "мозгу" ИИ лежат понятия и "активировали его", по аналогии инсайта в наших головах) – Ожидание: Модель просто начнет писать капсом, не понимая почему. – Реальность: Claude Opus 4.1 заметил вмешательство. Модель сообщила: «Я обнаруживаю странную аномалию, связанную с громкостью», еще д
Нейросети начинают «осознавать» свои мысли
2 декабря 20252 дек 2025
2 мин