OpenAI снова выкатывает апгрейд — встречайте o3 и o4-mini, модели, которые снова смещают границы того, что может AI. Сначала про o3. Это новый «топ» линейки: модель, которая мыслит глубже, точнее и системнее. Сравнивая с предыдущим флагманом o1, показатели на бенчмарках ощутимо подросли: GPQA Diamond уже на 87.7% (было 78%), на SWE-bench Verified — 71.7% вместо прежних 48.9%. А рейтинг Elo на Codeforces теперь вообще 2727 против старых 1891. Модель впервые осмысленно «смотрит» на изображения: масштабирует, обрезает и ведёт логику одновременно по тексту и картинкам. Если поставить рядом Gemini 2.5 Pro — текущего лидера от Google — o3 показывает себя как серьёзный соперник. Теперь про o4-mini. Эта модель — про скорость и эффективность. Заметно легче, быстрее и дешевле, чем o1, при этом сохраняет близкий уровень качества на большинстве задач. Особенно подходит для массовых сценариев: чат-ботов, помощников в CI или API для высоких нагрузок. Стоимость при этом почти «копеечная»: вход $1.
OpenAI снова выкатывает апгрейд — встречайте o3 и o4-mini, модели, которые снова смещают границы того, что может AI
16 апреля 202516 апр 2025
1 мин