Ну что же Вышел Grok 4, что во всех бенчмарках топ 1 Жду как смогу потыкать, но пока я сильно впечатлен. Human Last Exam прошел отметку 50%, хоть и на внутренних тестах. 44% для heavy - что доступен по новой подписке за 300 долларов По заявлению маска модель обгоняет докторов наук и в ближайшее время откроет множество нового в разных сферах 100% AIME, впервые бенчмарк закрыт полностью Также есть упоминания по “tools”, надеюсь это будет как в о3 - вызов в процессе выполнения/рассуждения