48,8 тыс подписчиков

Новые модели OpenAI галлюцинируют чаще — каждый третий их ответ неверный

21 апреля 202521 апр 2025

~1 мин

Новые модели OpenAI галлюцинируют чаще — каждый третий их ответ неверный «Рассуждающие» модели o3 и o4-mini отлично решают задачи в области программирования и математики, но при этом галлюцинируют чаще, чем их предшественники. Согласно внутренним тестам OpenAI, частота ошибок у этих моделей вдвое выше. Одним из возможных объяснений компания называет их склонность делать больше утверждений — это увеличивает как число точных ответов, так и количество ошибочных выводов. https://hightech.plus/2025/04/21/novie-modeli-openai-gallyuciniruyut-chashe---kazhdii-tretii-ih-otvet-nevernii

«Рассуждающие» модели o3 и o4-mini отлично решают задачи в области программирования и математики, но при этом галлюцинируют чаще, чем их предшественники. Согласно внутренним тестам OpenAI, частота ошибок у этих моделей вдвое выше. Одним из возможных объяснений компания называет их склонность делать больше утверждений — это увеличивает как число точных ответов, так и количество ошибочных выводов.

https://hightech.plus/2025/04/21/novie-modeli-openai-gallyuciniruyut-chashe---kazhdii-tretii-ih-otvet-nevernii