Новая версия GPT-4-04-09 показала себя в соревновании AI Mathematical Olympiad Prize на Kaggle, причем результаты впечатляют: успешно решено 5 из 10 задач, в то время как предыдущая версия справилась только с одной, и то с подсказками. Это значительно опережает конкурентов, включая Claude 3 Opus, который решил одну задачу без подсказок.
С обновленной моделью, которая скоро будет интегрирована в веб-версию ChatGPT с подпиской, и предстоящим запуском на платформе LMSYS Arena, мы в предвкушении увидеть эти улучшения в действии.
Кстати, выход новой версии GPT-4 совпал с обновлением рейтинга, в котором модель CMD-R+ от Cohere на 100B+ параметров обогнала исходные версии GPT-4 весны 2023 года, но Claude 3 Opus по-прежнему гордо восседает на первом месте. В ближайшее время ждем публикации метрик, демонстрирующих рост качества рассуждений и способностей GPT-4 в математике.