Найти в Дзене

OpenAI представила инновационную языковую модель o1

(C) OpenAI
(C) OpenAI

Компания OpenAI анонсировала новую языковую модель под названием o1, которая обладает улучшенными способностями к рассуждению и решению логических задач. В отличие от предыдущих версий, o1 имитирует процесс человеческого мышления, разбивая сложные задачи на более простые этапы, анализируя различные подходы и исправляя ошибки.

Модель o1 продемонстрировала впечатляющие результаты в тестах и соревнованиях, сравнимые с достижениями специалистов. В программировании o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и обошла 89% пользователей на платформе Codeforces. В математике модель вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), показывая уровень решения задач, предназначенных для самых одарённых школьников.

(C) OpenAI
(C) OpenAI

В области естественных наук модель o1 превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, который оценивает знания в химии, физике и биологии. По словам разработчиков, это не означает, что o1 умнее всех кандидатов наук, а лишь подтверждает способность модели решать задачи на уровне высококвалифицированных специалистов.

Модель o1 также показала превосходство над предыдущими версиями в различных тестах на интеллект и решение задач, таких как MMMU и MMLU. Ожидается, что новая версия значительно превосходит GPT-4o по большинству задач, связанных с логическим мышлением. Тесты AIME продемонстрировали, что o1 решила в среднем 83% задач, тогда как GPT-4o — лишь 13%.

Хотя o1 показывает меньше галлюцинаций по сравнению с GPT-4o, она работает медленнее и дороже. Кроме того, она уступает GPT-4o в энциклопедических знаниях и не может обрабатывать веб-страницы, файлы и изображения. Тем не менее, модель способна манипулировать данными, адаптируя решения под определённые результаты.

Успех модели o1 обусловлен новым алгоритмом обучения — «цепочкой мыслей». Эта методология позволяет модели улучшать рассуждения, обучаясь с помощью метода «обучения с подкреплением». Таким образом, o1 может распознавать и исправлять ошибки, разбивать задачи на более простые шаги и пробовать различные подходы, что значительно улучшает её способность к рассуждению, позволяя «думать» перед тем, как дать ответ на сложный вопрос.

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и через API для разработчиков. Несмотря на акцент на безопасность и этичность новой модели, прежде чем выпустить её для публичного использования, были проведены тесты на безопасность. Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов.

https://fantechno.com/openai-unveils-new-o1-language-model-with-advanced-reasoning/