Найти в Дзене
Тех Информ

Новая эра ИИ: модель o3 от OpenAI превзошла людей в интеллектуальном тесте! 🚀

В мире технологий новая звезда — OpenAI представила модель o3 и её компактную версию o3-mini, совершив настоящую революцию в области искусственного интеллекта. Этот релиз стал кульминацией марафона обновлений компании, и, как оказалось, OpenAI решила пропустить версию «o2», чтобы избежать путаницы с британским оператором связи O2. 📡 💡 Что делает o3 уникальной?
Модель оснащена механизмом перепроверки своих рассуждений, что значительно повышает точность ответов. Она разделяет сложные запросы на более мелкие задачи и шаг за шагом строит цепочку рассуждений, чтобы достичь идеального результата. Результаты говорят сами за себя: ✨ o3-mini: скорость под контролем
Младшая версия модели — o3-mini — получила возможность регулировать скорость обработки запросов. Чем больше времени даётся на вычисления, тем точнее становится ответ. 🛡️ Пока новые модели тестируются на безопасность, доступ к ним открыт только для исследователей. OpenAI планирует выпустить o3-mini в конце января, а полноценная o3
Новая эра ИИ: модель o3 от OpenAI превзошла людей в интеллектуальном тесте!
Новая эра ИИ: модель o3 от OpenAI превзошла людей в интеллектуальном тесте!

В мире технологий новая звезда — OpenAI представила модель o3 и её компактную версию o3-mini, совершив настоящую революцию в области искусственного интеллекта. Этот релиз стал кульминацией марафона обновлений компании, и, как оказалось, OpenAI решила пропустить версию «o2», чтобы избежать путаницы с британским оператором связи O2. 📡

💡 Что делает o3 уникальной?
Модель оснащена механизмом перепроверки своих рассуждений, что значительно повышает точность ответов. Она разделяет сложные запросы на более мелкие задачи и шаг за шагом строит цепочку рассуждений, чтобы достичь идеального результата.

Результаты говорят сами за себя:

  • 🧠 В тесте ARC-AGI, который оценивает способность решать совершенно новые задачи, o3 набрала 87,5%, превзойдя максимальные 85% у людей.
  • 💻 На программистском бенчмарке SWE-Bench Verified она обогнала свою предшественницу на 22,8 п.п.
  • 📊 В математическом тесте AIME 2024 модель справилась с 96,7% задач, оставив позади других участников.
  • 🔬 В тесте GPQA Diamond (биология, физика, химия уровня PhD) o3 достигла 87,7%, а в сложнейшем бенчмарке Frontier Math её результат составил рекордные 25,2% против 2% у других моделей!

o3-mini: скорость под контролем
Младшая версия модели — o3-mini — получила возможность регулировать скорость обработки запросов. Чем больше времени даётся на вычисления, тем точнее становится ответ.

🛡️ Пока новые модели тестируются на безопасность, доступ к ним открыт только для исследователей. OpenAI планирует выпустить o3-mini в конце января, а полноценная o3 станет доступна чуть позже.

💬 Ваш ход:
Какие возможности модели o3 вы хотели бы попробовать первыми? Делитесь своими мыслями в комментариях — какие задачи она могла бы решить для вас? 👇

TG Канал: https://t.me/tex_informer