Поисковый гигант представил «думающую» ИИ-модель Gemini 2.5 Pro. Она вырвалась в лидеры практически по всем метрикам, оставив прежних гегемонов позади. Приводим тесты новинки. Качественного скачка добились за счёт внедрения функции Reasoning в Gemini Pro следующего поколения. Как и в других моделях рассуждающего типа, этот механизм эффективен в сложных задачах. Контекст составляет 1 млн токенов, что позволяет принимать на вход крупные массивы данных. Например, длинные репозитории кода и документы на тысячи страниц. Позже окно расширят до 2 млн. Предусмотрена и мультимодальность: обрабатываются картинки, аудио, видео. В бенчмарках фиксируют результаты моделей за одну и за несколько попыток. В первом случае Gemini 2.5 Pro всегда лидирует, а во втором аналоги иногда лучше. Первенство в сложном тесте Humanity’s Last Exam (18,8%) говорит о том, что ИИ отлично справляется с разнообразными вопросами, требующими глубокого мышления. Ближайший конкурент o3-mini набирает только 14%. Впечатляет и
Превзошла СhatGPT и Grok 3. Что улучшили в нейросети Google Gemini 2.5 Pro?
27 марта 202527 мар 2025
23
1 мин