Компания Google официально представила Gemini 3.1 Pro — обновленную флагманскую модель искусственного интеллекта. Новинка показала впечатляющие результаты в тестах и превзошла своих главных конкурентов, включая последние версии GPT и Claude. Главным достижением стал прорыв в тесте ARC-AGI-2. Этот бенчмарк оценивает способность ИИ решать совершенно новые логические задачи, с которыми модель не сталкивалась в процессе обучения. Такой скачок говорит о том, что нейросеть стала гораздо лучше «рассуждать» и находить выходы из нестандартных ситуаций, а не просто подбирать ответы из базы данных. Согласно опубликованным таблицам Google, новая модель лидирует в большинстве ключевых тестов: Модель лишь незначительно уступает конкурентам в точечных проверках — например, нейросеть Claude Opus всё еще чуть лучше справляется с гуманитарными тестами. Экспертов впечатлили темпы работы Google: между версиями 3.0 и 3.1 прошло всего три месяца, но за это время разработчики смогли добиться двукратного рост
Google выпустила Gemini 3.1 Pro и снова обошла конкурентов в большинстве бенчмарков
20 февраля20 фев
4
1 мин