12 подписчиков

Сравнение точности ответов новой модели GPT o1 с текущей моделью GPT 4o.

Левый график: олимпиадные задачи по математике. Результаты модели соответствуют топ-500 студентов США, которые участвовали в этой олимпиаде.

Второй график: соревнование по программированию Codeforces. Там модель лучше чем 89% участвовавших.

Третий график: модель лучше чем кожаные мешки (доктора наук) в тестах на физику, биологию и химию.

Около минуты

12 сентября 2024