Найти в Дзене
REFRAME BURO

Gemini 3 Pro: умнее, но и галлюцинирует чаще

Gemini 3 Pro: умнее, но и галлюцинирует чаще. На днях Google выпустили новую версию флагманской нейросетевой модели, которую тут же начали называть самой передовой в мире. По итогам исследования от Artificial Analysis была раскрыта неожиданная сторона Gemini 3 Pro. На бенчмарке AA-Omniscience Index (6 000 вопросов) модель показала рекордную эрудицию: больше верных ответов, чем у всех конкурентов. Но цену этого превосходства составили 88% галлюцинаций в тех случаях, когда следовало просто сказать: «Не знаю». Интересно: чем выше амбиции модели (или, вернее, ее «создателей»), тем сложнее ей признать свою «неуверенность».

Gemini 3 Pro: умнее, но и галлюцинирует чаще.

На днях Google выпустили новую версию флагманской нейросетевой модели, которую тут же начали называть самой передовой в мире.

По итогам исследования от Artificial Analysis была раскрыта неожиданная сторона Gemini 3 Pro.

На бенчмарке AA-Omniscience Index (6 000 вопросов) модель показала рекордную эрудицию: больше верных ответов, чем у всех конкурентов.

Но цену этого превосходства составили 88% галлюцинаций в тех случаях, когда следовало просто сказать: «Не знаю».

Интересно: чем выше амбиции модели (или, вернее, ее «создателей»), тем сложнее ей признать свою «неуверенность».