Добавить в корзинуПозвонить
Найти в Дзене

Ну что же

Ну что же Вышел Grok 4, что во всех бенчмарках топ 1 Жду как смогу потыкать, но пока я сильно впечатлен. Human Last Exam прошел отметку 50%, хоть и на внутренних тестах. 44% для heavy - что доступен по новой подписке за 300 долларов По заявлению маска модель обгоняет докторов наук и в ближайшее время откроет множество нового в разных сферах 100% AIME, впервые бенчмарк закрыт полностью Также есть упоминания по “tools”, надеюсь это будет как в о3 - вызов в процессе выполнения/рассуждения

Ну что же

Вышел Grok 4, что во всех бенчмарках топ 1

Жду как смогу потыкать, но пока я сильно впечатлен. Human Last Exam прошел отметку 50%, хоть и на внутренних тестах. 44% для heavy - что доступен по новой подписке за 300 долларов

По заявлению маска модель обгоняет докторов наук и в ближайшее время откроет множество нового в разных сферах

100% AIME, впервые бенчмарк закрыт полностью

Также есть упоминания по “tools”, надеюсь это будет как в о3 - вызов в процессе выполнения/рассуждения

-2
-3
-4