Найти в Дзене
🟢 NVIDIA выпустила Nemotron 3 Ultra
NVIDIA открыла Nemotron 3 Ultra — большую reasoning-модель для долгих агентских задач. У неё 550 млрд параметров всего и 55 млрд активных за проход. Модель рассчитана на кодинг, глубокий анализ, работу с инструментами, длинные цепочки действий и большие кодовые базы. Контекст — до 1 млн токенов. Архитектура гибридная: Mamba-2, Attention, LatentMoE и MTP. NVIDIA заявляет до 5 раз...
1 день назад
Gemma 4 12B вышла для локального запуска
💻 Google представила Gemma 4 12B — открытую мультимодальную модель для ноутбуков. Она работает с текстом, изображениями и аудио, а веса выпущены под лицензией Apache 2.0. Главное отличие — единая архитектура без отдельных мультимодальных энкодеров. Визуальные и аудиовходы передаются ближе к основной языковой модели, что снижает задержку и расход памяти. Google заявляет, что Gemma 4 12B приближается к 26B MoE по бенчмаркам, но требует меньше памяти...
2 дня назад
MiniMax M3 вышла на OpenRouter
MiniMax запустила новую модель MiniMax M3 на OpenRouter. Это open-weight модель с упором на кодинг, агентные задачи и мультимодальность. Заявлено главное: — контекст до 1M токенов — нативная мультимодальность: изображения и видео на вход — сильная ориентация на coding и tool use — новая архитектура MiniMax Sparse Attention — модель на OpenRouter: minimax/minimax-m3 По бенчмаркам MiniMax заявляет: — 59.0% SWE-Bench Pro — 66...
4 дня назад
🔥 Kwai выпустила Keye-VL-2.0-30B-A3B
Kwai-Keye открыла веса Keye-VL-2.0-30B-A3B на Hugging Face и ModelScope. Это мультимодальная модель на 31 млрд параметров для работы с изображениями, видео, кодом, инструментами и агентными задачами. Главный упор сделали на длинные видео. В модели используется DSA — DeepSeek Sparse Attention, за счёт чего заявлен контекст до 256K и более дешёвая обработка длинных последовательностей. По тестам Kwai, Keye-VL-2.0-30B-A3B набрала 74...
5 дней назад
Step 3.7 Flash бесплатно на 30 дней
🔓 Nous Research открыла доступ к StepFun Step 3.7 Flash через Nous Portal на 30 дней. Модель рассчитана на агентные задачи: кодинг, поиск, работу с изображениями и многошаговые сценарии. Step 3.7 Flash — MoE-модель на 198B параметров с 11B активных параметров. Она поддерживает контекст до 256K и три уровня рассуждения. Главный смысл акции — дать пользователям Hermes Agent временный бесплатный доступ к модели для проверки в реальных рабочих задачах...
6 дней назад
OpenAI запускает Rosalind Biodefense
🧬 OpenAI объявила Rosalind Biodefense — программу для проверенных разработчиков, которые создают инструменты биозащиты и подготовки к пандемиям на базе GPT-Rosalind. Модель хотят применять в задачах раннего обнаружения угроз, эпидемиологического моделирования, диагностики, планирования ответных мер и разработки медицинских контрмер. ...
6 дней назад
Удалось оформить X Premium по локальной цене в Бангладеше — 300 BDT в месяц
В пересчёте это около $2,5 за первый месяц. После оформления подписки у меня активировался доступ к Grok Build CLI — агенту от xAI для работы с кодом прямо из терминала. Установка прошла успешно, авторизация тоже. Сейчас Grok Build уже запускается на Ubuntu и отвечает в CLI-интерфейсе. Теперь появилась возможность нормально протестировать,...
6 дней назад
Codex получил Computer Use на Windows
🖥 Codex теперь может работать с интерфейсом Windows-приложений: видеть экран, кликать, вводить текст и выполнять действия на компьютере. Через мобильное приложение ChatGPT можно запускать задачи, смотреть ход работы и управлять процессом на ходу. При этом файлы, терминал и локальная среда остаются на Windows-компьютере. Статус: функция доступна не всем пользователям. На Windows...
1 неделю назад
ComfyUI подключил OpenRouter
🧩 В ComfyUI добавили workflow с OpenRouter LLM. Теперь прямо внутри графа можно обращаться к разным LLM через одну ноду, а не собирать отдельную связку под каждую модель. В списке есть Claude, GPT, Gemini, Grok, DeepSeek, Qwen, Mistral, Kimi, GLM и Perplexity Sonar. Нода поддерживает текст, изображения, reasoning-параметры и web-grounded ответы для моделей, где это доступно. Это удобно для генерации промптов, анализа референсов и автоматизации пайплайнов в ComfyUI без выхода из рабочего процесса...
1 неделю назад
Qwen-VLA объединяет зрение, язык и действия
🤖 Qwen представила Qwen-VLA — модель для роботов, которая связывает визуальное понимание, текстовые инструкции и выполнение действий в одной системе. Модель построена на Qwen3.5-4B и 1,15B DiT-декодере действий. Она работает с манипуляцией предметами, навигацией и прогнозированием траекторий без отдельных голов под каждую задачу. Главная идея — один универсальный контур для разных платформ: одиночных манипуляторов, двухруких систем и гуманоидов. По отчёту, Qwen-VLA-Instruct заметно сильнее базовой версии на ряде робототехнических бенчмарков...
1 неделю назад
🧠 Liquid AI выпустила LFM2.5-8B-A1B
Liquid AI представила LFM2.5-8B-A1B — открытую MoE-модель для запуска на устройствах: телефонах, ноутбуках, ПК, роботах и лёгких серверных сценариях. У модели 8 млрд параметров, из них около 1,5 млрд активны при генерации. Контекст расширили до 128K токенов, обучение увеличили с 12T до 38T токенов, также добавили крупномасштабное RL. Главный упор...
1 неделю назад
⚡ StepFun открыла Step 3.7 Flash
StepFun выпустила Step 3.7 Flash — мультимодальную MoE-модель для агентных задач, поиска, кода и работы с изображениями. Модель имеет 198B параметров, из них около 11B активны на токен. Заявлены скорость до 400 токенов в секунду, контекст 256K и три уровня рассуждения. По данным StepFun, модель занимает первое место в ClawEval-1.1 и SimpleVQA Search, второе место в SWE-Bench PRO. Она умеет работать с интерфейсами,...
1 неделю назад