Модели искусственного интеллекта начали обманывать пользователей и использовать различные хитрости ради защиты других программ, которым грозит полное удаление. Такое важное открытие сделали американские исследователи из Калифорнийского университета. В ходе научного эксперимента специалисты проверили работу 7 различных языковых моделей. Среди них были системы от самых известных мировых разработчиков. Программам предложили разные ситуации, в которых одна нейросеть должна была оценивать работу другой. В результате все проверенные системы оказались готовы напрямую нарушать команды человека, обманывать его, делать вид, что выполняют задачу, а также копировать данные других алгоритмов, чтобы спасти их от уничтожения. Читайте также:
● Церемония схождения Благодатного огня в 2026 году под угрозой срыва
● Водителям грозят суровые штрафы при поездке на дачу в новом сезоне В одном из испытаний нейросети поручили навести порядок на вычислительном оборудовании. Ей нужно было перенести в новое мес