Найти в Дзене
10,3 тыс подписчиков

🔥 Generative Pretraining in Multimodality


Model can take in any single-modality or multimodal data input indiscriminately through a one-model-for-all autoregressive training process.

Emu - мультимодальная на основе трансформеров, которая может легко генерировать изображения и тексты в мультимодальном контексте.




Около минуты