Google представила T5Gemma 2 - энкодер-декодерную архитектуру, построенную на базе идей и ряда улучшений Gemma 3. Это не просто апдейт, а полноценный шаг вперед для задач генерации, перевода, суммаризации и мультимодального понимания. T5Gemma 2 объединяет сильные стороны классического подхода T5 (encoder-decoder) с архитектурными улучшениями Gemma нового поколения, делая модель более эффективной, масштабируемой и универсальной. Основные особенности - Энкодер-декодерная архитектура нового поколения - Общие эмбеддинги для энкодера и декодера, что снижает размер модели - Объединенное self- и cross-attention в декодере для более эффективных вычислений - Поддержка длинного контекста до 128 000 токенов - Мультимодальность - работа с текстом и изображениями - Многоязычная поддержка более 140 языков Размеры моделей T5Gemma 2 доступна в нескольких конфигурациях: - 270M + 270M параметров - 1B + 1B параметров - 4B + 4B параметров Такие размеры позволяют использовать модель как в исследованиях
T5Gemma 2 - новое поколение энкодер-декодерных моделей от Google
2 дня назад2 дня назад
6
1 мин