end0 | Дзен

1 день назад

• Вы подписаны

NVIDIA раскрыла архитектуру Rubin

🟢 Новый GPU получил 336 млрд транзисторов, 224 потоковых мультипроцессора и 896 тензорных ядер. Производительность в формате NVFP4 достигает 50 петафлопс. Rubin оснащён 288 ГБ памяти HBM4 с пропускной способностью до 22 ТБ/с. NVLink 6 обеспечивает обмен между ускорителями со скоростью до 3,6 ТБ/с. NVIDIA заявляет...

1 день назад

• Вы подписаны

Macaron-V1: агентная модель на базе GLM-5.2

🧠 Mind Lab выпустила Macaron-V1. Флагманская Venti насчитывает 748 млрд параметров: основа GLM-5.2 на 744 млрд и четыре LoRA-модуля по 1 млрд для диалога, агентных задач, программирования и генерации интерфейсов. Версия на Qwen 3.6 имеет 35 млрд параметров и рассчитана на локальный запуск. Система сама выбирает подходящий модуль для запроса. Специалисты сохраняют отдельные контексты и обмениваются краткими итогами, поэтому модели не приходится каждый раз перечитывать всю историю...

1 день назад

• Вы подписаны

Laguna S 2.1: 118 млрд параметров и контекст до миллиона токенов

🧠 Poolside выпустила Laguna S 2.1 — модель для программирования и длительных агентных задач. Архитектура MoE содержит 118 млрд параметров, но на каждый токен задействует только 8 млрд. Модель поддерживает контекст до 1 млн токенов и два режима: с рассуждением и без него. В Terminal-Bench 2.1 она набрала 70,2%, а в SWE-Bench Multilingual — 78,5%, опередив несколько значительно более крупных открытых моделей. Laguna S 2.1 можно запустить на одном NVIDIA DGX Spark...

1 день назад

• Вы подписаны

Google выпустила Gemini 3.6 Flash и 3.5 Flash-Lite

⚡ Gemini 3.6 Flash рассчитана на программирование, многошаговую автоматизацию и анализ изображений, видео и документов. Модель выполняет задачи с меньшим числом рассуждений, обращений к инструментам и повторных исправлений кода. Стоимость выходных токенов снизилась с $9 до $7,50 за миллион по сравнению с Gemini 3.5 Flash. Входные токены по-прежнему стоят $1,50 за миллион. Gemini 3.5 Flash-Lite предназначена для массовой обработки данных, разбора документов и работы вспомогательных агентов. Это самая быстрая и дешёвая модель семейства 3...

2 дня назад

• Вы подписаны

NVIDIA выпустила Cosmos 3 Edge

🤖 Открытая модель объединяет анализ изображений и видео, прогнозирование сцен, генерацию видео и выбор действий. В ней 4 млрд параметров, включая модуль рассуждений на базе Nemotron размером 2 млрд параметров. Cosmos 3 Edge предназначена для роботов, беспилотного транспорта и систем видеоаналитики. Модель можно запускать локально на NVIDIA Jetson, DGX Spark и других совместимых устройствах. По данным NVIDIA, она заняла первое место в VANTAGE-Bench среди открытых моделей сопоставимого размера...

2 дня назад

• Вы подписаны

🎙 Qwen-Audio-3.0-TTS вышла в двух версиях

Tongyi Lab представила новую модель озвучивания текста. Flash рассчитана на общение в реальном времени, а Plus — на более качественную генерацию речи. Модель поддерживает 16 языков, включая русский. Голосом можно управлять обычными указаниями: задавать эмоцию, темп, громкость, тембр и акцент...

Покупайте СтеллыИ дарите их за контент