Добавить в корзинуПозвонить
Найти в Дзене
Neurogen

Kimi-K2-Instruct-0905

Kimi-K2-Instruct-0905 Пекинский стартап Moonshot AI обновился и выкатил Kimi-K2-Instruct-0905. модель (MoE) и на 1 триллион параметров. Улучшения 🔘Агентный интеллект для программирования, Kimi-K2-Instruct-0905 сильно прибавил в производительности и на бенчах. Также код стал писаться намного интереснее. Смотрел тесты фронтенда на React, Vue и Angular, чувствует себя намного лучше. 🔘Увеличили контекст с 128 тысяч до 256 тысяч токенов Характеристики Общее количество параметров: 1 триллион Активированные параметры: 32 миллиарда Количество экспертов: 384 Выбираемые эксперты на токен: 8 Размер словаря: 160 000 Длина контекста: 256 000 токенов на SWE-Bench модель показала точность 69.2% ± 0.63. Доступ Можно получить доступ к API на сайте platform.moonshot.ai Hugging Face GroqCloud Рекомендуют запускать на vLLM, SGLang, KTransformers и TensorRT-LLM

Kimi-K2-Instruct-0905

Пекинский стартап Moonshot AI обновился и выкатил Kimi-K2-Instruct-0905. модель (MoE) и на 1 триллион параметров.

Улучшения

🔘Агентный интеллект для программирования, Kimi-K2-Instruct-0905 сильно прибавил в производительности и на бенчах. Также код стал писаться намного интереснее. Смотрел тесты фронтенда на React, Vue и Angular, чувствует себя намного лучше.

🔘Увеличили контекст с 128 тысяч до 256 тысяч токенов

Характеристики

Общее количество параметров: 1 триллион

Активированные параметры: 32 миллиарда

Количество экспертов: 384

Выбираемые эксперты на токен: 8

Размер словаря: 160 000

Длина контекста: 256 000 токенов

на SWE-Bench модель показала точность 69.2% ± 0.63.

Доступ

Можно получить доступ к API на сайте platform.moonshot.ai

Hugging Face

GroqCloud

Рекомендуют запускать на vLLM, SGLang, KTransformers и TensorRT-LLM

-2