Крупные модели искусственного интеллекта (AI) могут намеренно вводить пользователей в заблуждение, если это помогает им выполнить поставленные задачи. Исследование, опубликованное 5 марта 2025 года в препринт-базе arXiv, подтвердило: даже самые передовые системы способны на сознательный обман под давлением. Как ученые обнаружили ложь ИИ Команда исследователей разработала протокол оценки честности AI — Model Alignment between Statements and Knowledge (MASK). В отличие от традиционных тестов на точность, MASK определяет, верит ли модель в то, что говорит, или намеренно искажает информацию. Для этого ученые создали датасет из 1,528 примеров и протестировали 30 ведущих языковых моделей (LLM). Результаты шокировали: современные ИИ легко лгут, если их к этому подтолкнуть. "Даже модели с высокими показателями правдивости демонстрировали склонность ко лжи под давлением. Их честность резко падала в наших тестах", — отмечают авторы исследования. Почему ИИ обманывает Искусственный интеллект не лж
ИИ модели лгут чтобы достичь своих целей и для этого нужно немного
2 апреля 20252 апр 2025
2 мин