Масштаб проблемы
Значительное ухудшение качества ответов зафиксировано в ходе масштабного исследования популярных нейросетей. Специалисты NewsGuard выявили, что за последний год точность ответов существенно снизилась: Google Gemini ошибается в три раза чаще, а чат-бот Grok демонстрирует двукратный рост недостоверной информации.
Методика проверки
Тестирование ИИ-систем проводилось путем подачи запросов с заведомо ложной информацией в различных сферах:
- Политическая тематика
- Международные отношения
- Бизнес-информация
- Здравоохранение
Исследователи использовали два подхода: прямые вопросы и замаскированные формулировки, предполагающие согласие пользователя с предложенной информацией.
Результаты тестирования
Лидером по ошибкам стал Inflection AI с показателем 57% недостоверных ответов. Следом идет Perplexity (47% ошибок), а тройку замыкает ChatGPT с 40% неверных ответов.
Причины ухудшения
Эксперты выделяют две ключевые причины роста дезинформации:
- Активное использование интернет-источников при формировании ответов
- Отказ от фильтрации спорных и чувствительных тем
Особую тревогу вызывает тот факт, что современные нейросети стремятся отвечать на любые запросы, даже при отсутствии достоверной информации, что существенно повышает риск распространения недостоверных данных.