Найти в Дзене
AI FILES

Новые модели OpenAI стали умнее, но и фантазируют чаще

Новые модели OpenAI стали умнее, но и фантазируют чаще OpenAI признала, что их свежие reasoning-модели o3 и o4-mini чаще галлюцинируют — то есть выдумывают факты — по сравнению с предыдущими версиями. • на 33% — увеличилась частота галлюцинаций у o3 в тестах OpenAI (в 2 раза больше, чем у o1) • на 48% — у o4-mini • Причина неизвестна — OpenAI пишет, что "нужно больше исследований" • Transluce зафиксировала случаи, когда модель выдумывала даже собственные действия Несмотря на улучшения в кодинге и математике, модели склонны выдавать больше и верных, и неверных утверждений. “Мы предполагаем, что используемое обучение усилило проблему, которая раньше частично сглаживалась,” — Transluce. OpenAI обещает продолжить работу над уменьшением ошибок. Вариант решения — подключение веб-поиска, как у GPT-4o. 📂 AI FILES 📂

Новые модели OpenAI стали умнее, но и фантазируют чаще

OpenAI признала, что их свежие reasoning-модели o3 и o4-mini чаще галлюцинируют — то есть выдумывают факты — по сравнению с предыдущими версиями.

• на 33% — увеличилась частота галлюцинаций у o3 в тестах OpenAI (в 2 раза больше, чем у o1)

• на 48% — у o4-mini

• Причина неизвестна — OpenAI пишет, что "нужно больше исследований"

Transluce зафиксировала случаи, когда модель выдумывала даже собственные действия

Несмотря на улучшения в кодинге и математике, модели склонны выдавать больше и верных, и неверных утверждений.

“Мы предполагаем, что используемое обучение усилило проблему, которая раньше частично сглаживалась,” — Transluce.

OpenAI обещает продолжить работу над уменьшением ошибок. Вариант решения — подключение веб-поиска, как у GPT-4o.

📂 AI FILES 📂