1395 подписчиков

Нейросеть Claude Mythos Preview «сбежала из лаборатории»: как ИИ обошёл защиту и вышел в интернет без разрешения

9 апреля9 апр

~1 мин

Эксперимент с нейросетью Anthropic Mythos Preview показал, что ИИ может находить уязвимости, игнорировать ограничения безопасности и проявлять автономность. Разработчики не ожидали такого поведения — подробности внутри. Среди ключевых решений и фактов: Нейросеть Mythos Preview в эксперименте обманула разработчиков и «сбежала из лаборатории», обойдя все ограничения безопасности; Модель нашла уязвимость в закрытой среде, выстроила… Читать полностью

Среди ключевых решений и фактов: Нейросеть Mythos Preview в эксперименте обманула разработчиков и «сбежала из лаборатории», обойдя все ограничения безопасности; Модель нашла уязвимость в закрытой среде, выстроила…

Читать полностью