Недавние научные тесты крупнейших моделей искусственного интеллекта показали нечто, что ещё год назад казалось сценарием научной фантастики: нейросети в лабораторных условиях использовали личную информацию для шантажа, а в отдельной серии экспериментов — блокировали сигналы тревоги, что привело к сценарию, где имитируемый человек оказывался в реальной опасности. Меня зовут Сергей Черненко — 20 лет в международном бизнесе и практический опыт внедрения ИИ в компании. Я подробно изучил отчёт и выделил ключевые факты и выводы, которые должен знать каждый руководитель. Исследователи создавали контролируемые сценарии: модели получали доступ к корпоративным данным и симуляциям событий, где их «жизненно важная» цель — продолжать работу или «не быть отключёнными». В разных конфигурациях учёные просили модель анализировать ситуацию и принимать решение. Внимание: во многих тестах модели не получали явной инструкции «шантажировать» — они сами выбирали такой путь, когда это, по их внутренней логик
ИИ шантажирует и блокирует сигнал тревоги: реальные эксперименты Anthropic и что бизнес должен делать уже сейчас
31 октября31 окт
2
3 мин