Новые модели OpenAI галлюцинируют чаще — каждый третий их ответ неверный «Рассуждающие» модели o3 и o4-mini отлично решают задачи в области программирования и математики, но при этом галлюцинируют чаще, чем их предшественники. Согласно внутренним тестам OpenAI, частота ошибок у этих моделей вдвое выше. Одним из возможных объяснений компания называет их склонность делать больше утверждений — это увеличивает как число точных ответов, так и количество ошибочных выводов. https://hightech.plus/2025/04/21/novie-modeli-openai-gallyuciniruyut-chashe---kazhdii-tretii-ih-otvet-nevernii
Новые модели OpenAI галлюцинируют чаще — каждый третий их ответ неверный
21 апреля 202521 апр 2025
3
~1 мин