Добавить в корзинуПозвонить
Найти в Дзене

epoch.ai ищет финансирование для запуска бенчмарка mirrorcode

Директор epoch.ai сообщил о необходимости привлечь $600 тыс., либо минимум $100 тыс. для запуска бенчмарка mirrorcode — аналога programbench. В mirrorcode моделям предоставляют больше времени и токенов для воспроизведения программ, что увеличивает стоимость каждого запуска. Ранее OpenAI запускала бенчмарк на сумму около $1 млн по API-ценам. Ожидается релиз Claude Sonnet 4.7 и GPT 5.6 для оценки их результатов на новых бенчмарках. https://dzen.ru/id/5c0e38ff46ef5c00aaa80527

epoch.ai ищет финансирование для запуска бенчмарка mirrorcode

Директор epoch.ai сообщил о необходимости привлечь $600 тыс., либо минимум $100 тыс. для запуска бенчмарка mirrorcode — аналога programbench.

В mirrorcode моделям предоставляют больше времени и токенов для воспроизведения программ, что увеличивает стоимость каждого запуска.

Ранее OpenAI запускала бенчмарк на сумму около $1 млн по API-ценам. Ожидается релиз Claude Sonnet 4.7 и GPT 5.6 для оценки их результатов на новых бенчмарках.

https://dzen.ru/id/5c0e38ff46ef5c00aaa80527