chernovdev | Дзен

Новая модель Gemma 4 вышла, и она интересная. Между E4B и 26B A4B была пустота, и 12B-модель заняла её органично. Но это Google DeepMind — без архитектурного эксперимента не обошлось. Так в чём же особенность Gemma 4 12B? Она без энкодеров! Термин «encoder-free» может вызывать путаницу. Современные генеративные LLM и так обычно decoder-only. Речь о другом: из модели убрали энкодеры для обработки аудио и изображений. При этом мультимодальные возможности сохранились. Убрав энкодеры, которые отвечали за осмысление мультимодальных входов, Google DeepMind перенесли эту нагрузку на саму LLM. Все модальности теперь объединены внутри одной модели...

1 день назад

JetBrains открыла исходный код Mellum2 — модели, которая пойдёт туда, где не доберётся Claude Code

В понедельник JetBrains открыла исходный код Mellum2. Это кодовая модель на 12 миллиардов параметров. Она заточена под инфраструктурный слой agentic AI-систем (систем, где ИИ действует автономно). Задачи включают маршрутизацию, retrieval-пайплайны (конвейеры поиска данных), работу sub-агентов (вспомогательных ИИ-агентов) и приватное on-premises развёртывание (на собственных серверах клиента). Всё это — территории, куда Anthropic Claude Code не имеет доступа. Mellum2 — наследник Mellum. Предыдущая модель на 4 млрд параметров появилась в конце 2024 года как проприетарный инструмент автодополнения кода в IDE от JetBrains...

1 день назад

⚡️Вышло новое исследование Self-Service-круг Громова 2026

Оно показывает, как российские платформы помогают бизнес-пользователям работать автономно во всей архитектуре данных, а не только в BI. В отчет вошло 20+ российских решений: от BI, ETL и IBP-систем до облачных сервисов и платформ по работе с семантическим слоем. Среди которых: Yandex DataLens, Modus BI/ETL, Loginom, Dat. ax, DataForge,Visiology, PIX BI, Rapeed и другие. ➡️Отчет поможет понять: – где self-service – реальная управляемая модель, а где – набор разрозненных функций или маркетинговая...

1 неделю назад

opus48 + команда /goal

= ✔ Goal achieved (2h · 1 turn · 363.4k tokens) ✻ Crunched for 2h 2m 48s ※ recap: Цель — привести бэк в соответствие с изменениями фронта; использовано контекста = 51%

1 неделю назад

Claude - Opus-48 вышел, тестируем

? )

1 неделю назад