Найти тему
75 подписчиков

Text-2-image генерация локально на мобильных телефонах за несколько секунд —SnapFusion.


Достигнуто путем внедрения эффективной архитектуры UNet (с выявлением избыточности исходной модели) и сокращения вычислений декодера изображения за счет дистилляции данных. Далее, пошаговая дистилляция улучшается, исследуя стратегии обучения и вводя регуляризацию из руководства без классификатора.

Эксперименты на датасете MS-COCO показывают, что SnapFusion с 8 шагами денойза генерит лучше, чем модель Stable Diffusion v1.5 с 50 шагами.

Кода пока нет
Text-2-image генерация локально на мобильных телефонах за несколько секунд —SnapFusion.
02:33
Около минуты