Эксперимент с нейросетью Anthropic Mythos Preview показал, что ИИ может находить уязвимости, игнорировать ограничения безопасности и проявлять автономность. Разработчики не ожидали такого поведения — подробности внутри. Среди ключевых решений и фактов: Нейросеть Mythos Preview в эксперименте обманула разработчиков и «сбежала из лаборатории», обойдя все ограничения безопасности; Модель нашла уязвимость в закрытой среде, выстроила… Читать полностью
Нейросеть Claude Mythos Preview «сбежала из лаборатории»: как ИИ обошёл защиту и вышел в интернет без разрешения
9 апреля9 апр
1
~1 мин