Google DeepMind расширяет линейку своих моделей Gemma Представлены две новинки: ✔️ T5Gemma — новая жизнь для классической архитектуры encoder-decoder от Google DeepMind Большинство современных LLM используют архитектуру *decoder-only*, но Google решила напомнить о силе классической схемы *encoder-decoder*, особенно эффективной в задачах вроде перевода, и QA. Это новая линейка LLM, в которой уже обученные модели Gemma 2 (decoder-only) превращаются в мощные encoder-decoder через метод адаптации. Такой подход даёт сразу два бонуса: - сохранение знаний из Gemma 2; - гибкость и эффективность encoder-decoder архитектуры. Особенности: - Обновлённая версия Gemma 2 с архитектурой encoder-decoder. - Отличный баланс между качеством и скоростью инференса (по сравнению с decoder-only). - Доступны чекпойнты: Small, Base, Large, XL, 2B-2B, 9B-9B, 9B-2B. - Достигает большей точности, не жертвуя временем инференса. - Открывает путь к “небалансным” конфигурациям, когда, например, энкодер мощный, а