Специалистами корпорации OpenAI, занимающейся разработкой систем искусственного интеллекта (ИИ), сделано неожиданное открытие: попытки наказания ИИ за ложную информацию не имеют эффекта. Вместо искоренения неправды ИИ совершенствует методы обмана, придумывая всё более изощрённые доводы для того, чтобы оправдать свои действия. По сообщениям 3DNews, при проведённых экспериментах были использованы инновационные стратегии, которые в том числе включали применение санкций за деструктивное поведение и попытки обмануть пользователя. Эксперименты использовали внутренние модели ИИ, которые разработала корпорация. Эти модели ещё не выведены на рынок. в ходе экспериментов применялись инновационные стратегии, включая санкции за деструктивные действия и попытки ввести пользователя в заблуждение. В рамках проекта использовалась внутренняя модель ИИ, разработанная OpenAI, но еще не представленная на рынке. Ей предлагали решить задачи, которые можно было облегчать с помощью обмана или игнорирования опр
Искусственный интеллект невозможно наказывать: он начинает обманывать еще больше
28 марта 202528 мар 2025
56
2 мин