10 подписчиков
Сравнение точности ответов новой модели GPT o1 с текущей моделью GPT 4o.
Левый график: олимпиадные задачи по математике. Результаты модели соответствуют топ-500 студентов США, которые участвовали в этой олимпиаде.
Второй график: соревнование по программированию Codeforces. Там модель лучше чем 89% участвовавших.
Третий график: модель лучше чем кожаные мешки (доктора наук) в тестах на физику, биологию и химию.
Около минуты
12 сентября 2024