53,7 тыс подписчиков

Одна модель ИИ может обманом заставить другую нарушить правила.

Многие модели искусственного интеллекта предназначены для выполнения небольших конкретных задач. Они умеют отвечать на вопросы пользователей, генерировать тексты и изображения, а еще отклонять запросы, если программа посчитает их вредными или незаконными. Программисты из компании Leap Laboratories нашли способ обхода таких правил. Они добились того, чтобы модели ИИ могли убеждать друг друга выполнять указания, которые им выполнять не положено.

Прочитать статью

Одна модель ИИ может обманом заставить другую нарушить правила. Многие модели искусственного интеллекта предназначены для выполнения небольших конкретных задач.

Около минуты

25 ноября 2023

163 читали