Найти в Дзене
Nemotron 3 Ultra (550B‑A55B): открытая модель NVIDIA для сложных ИИ-агентов
Компания NVIDIA представила Nemotron 3 Ultra (550B‑A55B) — открытую языковую модель с 550 миллиардами параметров, из которых 55 миллиардов активны одновременно. Модель ориентирована на работу в составе ИИ-агентов и рассчитана на сложные сценарии, где требуется удерживать длинный контекст и взаимодействовать с внешними инструментами. В основе Nemotron 3 Ultra лежит гибридная архитектура Mamba2 + Transformer с соотношением 4:1 в пользу Mamba. Это позволяет эффективно обрабатывать большие объёмы информации и поддерживать сложные многошаговые задачи...
3 дня назад
Ideogram покусал Krea
Команда Krea решила опубликовать исходный код своей новой модели Krea K2. Это событие вызвало заметную реакцию в сообществе — не только из-за самого факта опенсорса, но и из-за того, что недавно Ideogram выпустил обновление, которое многие восприняли как прямой вызов конкурентам. Судя по обсуждениям, между командами Krea и Ideogram возникла своеобразная гонка: обе компании активно развивают генеративные инструменты для работы с изображениями и текстом. Теперь Krea делает ставку на открытость — и это явно не осталось незамеченным...
3 дня назад
LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров
Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными. LongCat-Video-Avatar 1.5 поддерживает...
3 дня назад
Компрессия KV-кэша от Huawei: как работает и зачем нужна
Huawei представила инструмент для компрессии KV-кэша в больших языковых моделях. Эта технология ориентирована на ускорение генерации текста и снижение нагрузки на GPU‑память, что особенно актуально при работе с квантованными моделями. В основе архитектуры лежит комбинация вариационного автоэнкодера (VAE) и механизма ранней остановки (early exit). Такой подход позволяет не только уменьшить задержку при генерации, но и оптимизировать использование ресурсов, что важно для обработки запросов в реальном времени...
3 дня назад
Gemma 4 12B: мультимодальная модель Google для локального запуска
Компания Google представила Gemma 4 12B — открытую мультимодальную модель, которую можно запускать прямо на ноутбуках. Она работает не только с текстом, но и с изображениями и аудио, что делает её универсальным инструментом для самых разных задач. Главная особенность Gemma 4 12B — единая архитектура без отдельных мультимодальных энкодеров. Это позволяет экономить память и ускоряет обработку данных: модель справляется с задачами с низкой задержкой, не требуя мощных серверов. Для запуска потребуется...
3 дня назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала