89 подписчиков

Text-2-image генерация локально на мобильных телефонах за несколько секунд —SnapFusion.

Достигнуто путем внедрения эффективной архитектуры UNet (с выявлением избыточности исходной модели) и сокращения вычислений декодера изображения за счет дистилляции данных. Далее, пошаговая дистилляция улучшается, исследуя стратегии обучения и вводя регуляризацию из руководства без классификатора.

Эксперименты на датасете MS-COCO показывают, что SnapFusion с 8 шагами денойза генерит лучше, чем модель Stable Diffusion v1.5 с 50 шагами.

Бумага

Кода пока нет

Text-2-image генерация локально на мобильных телефонах за несколько секунд —SnapFusion.

02:33

Около минуты

2 июня 2023