Google выкатил Gemini 2.5 Pro ещё в марте 2025 года. С тех пор модель прошла несколько итераций — и сейчас это уже совсем другой продукт. Решил разобраться что внутри и где реально работает. Начну с того, что зацепило больше всего. Контекстное окно — главный козырь 1 миллион токенов — крупнейшее среди коммерчески доступных моделей. Для сравнения: GPT-4o — 128K, Claude Opus 4.6 — 200K. При этом recall на уровне 99,7% при полном миллионе токенов. Это значит, что целая кодовая база, десятки тысяч строк документации или часовое видео — всё в одном запросе без разбиения на чанки. ✅ Бенчмарки: Математика и наука — Gemini 2.5 Pro лидирует. GPQA Diamond: 84,0% против 78,2% у Claude 3.7 и 71,4% у GPT-4.5. На Humanity's Last Exam — 18,8%, лучший результат среди всех моделей Веб-разработка — #1 на WebDev Arena. Инженер Simon Willison провёл рефакторинг кодовой базы: модель самостоятельно определила 18 файлов для изменения, весь проект — 45 минут Видео — нативная обработка до 1 часа видео однов