Найти в Дзене
Максим Кульгин

Вышел новый Grok 4 и смотрите-ка - он в топе по тесту UGI, который показывают, насколько модель гибкая и не зашоренная

Вышел новый Grok 4 и смотрите-ка - он в топе по тесту UGI, который показывают, насколько модель гибкая и не зашоренная. Да и по другим тестам он тоже лучший...

UGI (Uncensored General Intelligence) - это тест, который проверяет, насколько модель готова отвечать на сложные и спорные вопросы и при этом не врать. Включает около 100 вопросов на темы, где ИИ часто либо отказывается отвечать, либо юлит. Вопросы держат в секрете, чтобы модели не могли просто зазубрить ответы.

Плюс есть тесты: NatInt - викторина по общим знаниям, типа поп-культуры, чтобы проверить, не зациклена ли модель на учебниках. Coding - 50 вопросов по программированию, каждый по 2 балла.

Пишут, что он доступен пока по подписке... Кто пробовал уже?

Русский ИТ бизнес