Google AI представила технологию Multi-Token Prediction для семейства Gemma 4. Ключевое нововведение: лёгкая drafter-модель предсказывает несколько токенов вперёд, а тяжёлый 31B-проверочник считывает их параллельно за один проход. Раньше GPU простаивал в ожидании загрузки данных из памяти — теперь проверка идёт непрерывным потоком. Результат — ускорение до 3 раз без потери качества по сравнению с авторегрессивным декодированием. Модели доступны на Hugging Face под лицензией Apache 2.0. Gemma 4 26B MoE теперь реально запустить локально на Apple Silicon или обычном ноутбуке с приемлемой скоростью генерации. Для edge-устройств (E2B/E4B) добавлена кластеризация в embedder-слое — дополнительный выигрыш производительности на мобильных платформах. Veai обновилась до версии 5.10. Главная фича — кросс-платформенная совместимость скиллов. Раньше скиллы Claude Code хранились в .claude, Cursor в .cursor, Veai в .veai. При смене ассистента приходилось копировать их вручную и следить за синхронизаци
Gemma 4 ускоряется втрое, Veai 5.10 объединяет скиллы, а русские LLM проверят на уязвимости
8 мая8 мая
14
2 мин