484,6 тыс подписчиков

Представлена Kimi-K2 Thinking: китайская ИИ-модель умнее GPT-5

8 ноября8 ноя

2 мин

Стартап Moonshot AI, базирующийся в Китае, запустил K2 Thinking — открытую нейросетевую модель, которая способна конкурировать с дорогостоящими решениями от американских гигантов. Это не просто еще один языковой инструмент. Это система, которая думает пошагово, использует внешние ресурсы и способна решать задачи, требующие глубокого анализа. Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200−300 последовательных операций с инструментами без участия человека. Представьте: система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Все это происходит автоматически, в одном потоке мышления. На тесте Humanity’s Last Exam, экзамене с тысячами вопросов экспертного уровня из более чем сотни дисциплин, K2 Thinking показала 44,9%. На BrowseComp, который проверяет способность постоянно просматривать ве

Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200−300 последовательных операций с инструментами без участия человека. Представьте: система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Все это происходит автоматически, в одном потоке мышления.

На тесте Humanity’s Last Exam, экзамене с тысячами вопросов экспертного уровня из более чем сотни дисциплин, K2 Thinking показала 44,9%. На BrowseComp, который проверяет способность постоянно просматривать веб и искать информацию, результат 60,2% при человеческом базовом уровне в 29,2%. Для задач кодирования на SWE-Bench модель достигла 71,3% успеха.

Компания продемонстрировала возможности системы на практических примерах. Один из них особенно показателен: задача по гиперболической геометрии уровня PhD. K2 Thinking решила ее через 23 вложенных цикла рассуждений и обращений к инструментам. Система искала научные статьи, запускала Python-код для расчетов, проверяла промежуточные результаты и в итоге вывела точную формулу. Это способность планировать, думать, действовать и адаптироваться на сотнях этапов — то, что раньше отличало человеческий интеллект.

Практическое применение охватывает разные сферы. В разработке K2 Thinking показывает улучшения при работе с HTML, React и сложными фронтенд-компонентами. Система создает полностью функциональные адаптивные сайты или подобия Word из единственного текстового запроса.

Конкуренция в секторе моделей с расширенным рассуждением накаляется. OpenAI и Anthropic держат свои системы закрытыми, что дает им преимущество контроля и дохода, но ограничивает доступность. Moonshot AI выбрала другой путь — открытость. Это позволяет исследователям, компаниям и независимым разработчикам экспериментировать, адаптировать систему под свои нужды и строить на ее основе решения.

Модель доступна на сайте и через API, что означает: любой разработчик прямо сейчас может попробовать её в деле. Это существенно отличается от подхода американских конкурентов, которые выпускают свои системы с ограничениями доступа.

Также ранее было представлено умное кольцо с микрофоном и ИИ-помощником. Подробности в статье.

Гаджеты и электроника

5,73 млн интересуются