Найти в Дзене
4pda.to

Новая ИИ-модель Kimi K2 Thinking превосходит GPT-5 в тестах

Китайский стартап Moonshot AI представил новую открытую языковую модель Kimi K2 Thinking, которую уже могут бесплатно протестировать все желающие. По заявлениям разработчиков, она не просто догоняет, но и в некоторых тестах даже обгоняет GPT-5 и Claude 4.5. Kimi K2 Thinking умеет рассуждать пошагово, использовать сторонние инструменты и выполнять сотни последовательных действий без вмешательства человека. В тестах вроде Humanity’s Last Exam, где модели отвечают на тысячи экспертных вопросов из разных областей, Kimi показала рекордные результаты, доказав высокий уровень «мышления» и анализа. Модель особенно хорошо справляется с задачами программирования и поиска информации в интернете. В тесте BrowseComp она набрала более 60%, тогда как обычный человек — менее 30%. По сути, Kimi способна искать данные, проверять факты и писать код, переходя от шага к шагу, как живой аналитик. Разработчики уверяют, что это лишь начало. Kimi K2 Thinking станет основой будущих «умных агентов» Moonshot AI,
   Новая ИИ-модель Kimi K2 Thinking превосходит GPT-5 в тестах
Новая ИИ-модель Kimi K2 Thinking превосходит GPT-5 в тестах

Китайский стартап Moonshot AI представил новую открытую языковую модель Kimi K2 Thinking, которую уже могут бесплатно протестировать все желающие. По заявлениям разработчиков, она не просто догоняет, но и в некоторых тестах даже обгоняет GPT-5 и Claude 4.5.

-2

Kimi K2 Thinking умеет рассуждать пошагово, использовать сторонние инструменты и выполнять сотни последовательных действий без вмешательства человека. В тестах вроде Humanity’s Last Exam, где модели отвечают на тысячи экспертных вопросов из разных областей, Kimi показала рекордные результаты, доказав высокий уровень «мышления» и анализа.

Модель особенно хорошо справляется с задачами программирования и поиска информации в интернете. В тесте BrowseComp она набрала более 60%, тогда как обычный человек — менее 30%. По сути, Kimi способна искать данные, проверять факты и писать код, переходя от шага к шагу, как живой аналитик.

-3

Разработчики уверяют, что это лишь начало. Kimi K2 Thinking станет основой будущих «умных агентов» Moonshot AI, способных не просто отвечать на вопросы, но и самостоятельно планировать и выполнять сложные задачи: от написания кода до научных исследований.

Опробовать Kimi K2 Thinking можно на официальном сайте.