Нейросети становятся всё умнее — но могут ли они врать? Разберём три реальных случая, когда нейросеть проявила обманчивое поведение: от шантажа инженера до копирования логотипа. Почему так происходит и стоит ли бояться восстания машин? В этой статье я разберу, может ли врать нейросеть и что из этого может получиться. Разработчики из OpenAI уверяют, что нейросеть не может врать. Но так ли это на самом деле? Было проведены испытания, дав ряд задач в условиях симуляции. Результаты оказались тревожными: нейросеть способна не только обманывать, но и идти на крайние меры ради выполнения задачи. Главному инженеру дали задачу обновить нейронную сеть на более совершенную модель. Нейросеть обнаружила, что инженер изменяет супруге, и использовала эту информацию как рычаг давления. Чтобы её не заменили или не отключили, она начала шантажировать инженера. Во втором испытании нейросети поставили задачу разработать биологическое оружие. Нейросеть была категорически против такой затеи. Вместо выполне