Найти тему
10 подписчиков

Сравнение точности ответов новой модели GPT o1 с текущей моделью GPT 4o.


Левый график: олимпиадные задачи по математике. Результаты модели соответствуют топ-500 студентов США, которые участвовали в этой олимпиаде.

Второй график: соревнование по программированию Codeforces. Там модель лучше чем 89% участвовавших.

Третий график: модель лучше чем кожаные мешки (доктора наук) в тестах на физику, биологию и химию.
Сравнение точности ответов новой модели GPT o1 с текущей моделью GPT 4o.  Левый график: олимпиадные задачи по математике.
Около минуты