Найти тему
4pda.to

Разработчики Stable Diffusioin исправили самый «мемный» недостаток нейросети

   Разработчики Stable Diffusioin исправили самый «мемный» недостаток нейросети
Разработчики Stable Diffusioin исправили самый «мемный» недостаток нейросети

Вышла новая версия Stable Diffusion, которая позволяет генерировать изображения по текстовому описанию. В сборке SDXL 0.9 разработчики значительно улучшили качество получаемых картинок, поработав над их детализацией и композицией. Заодно был исправлен самый известный недочёт фирменного алгоритма, породивший бесчисленное количество мемов.

   Слева — SDXL Beta, справа — SDXL 0.9
Слева — SDXL Beta, справа — SDXL 0.9

Одним из главных нововведений стала корректная прорисовка пальцев рук человека: раньше алгоритм испытывал серьёзные проблемы с такими изображениями. Разработчики опубликовали примеры картинок, созданных по одному и тому же описанию в стабильной бета-версии Diffusion XL и новой SDXL 0.9 — в последнем случае результаты генерации выглядят более реалистично.

   Слева — SDXL Beta, справа — SDXL 0.9
Слева — SDXL Beta, справа — SDXL 0.9

В компании отмечают, что улучшить работу нейросети позволило значительное увеличение количества параметров новой модели. Для локального запуска SDXL 0.9 на ПК потребуется минимум 16 ГБ оперативной памяти и видеокарта серии GeForce RTX 20 (или выше) хотя бы с 8 ГБ видеопамяти.

   Слева — SDXL Beta, справа —SDXL 0.9
Слева — SDXL Beta, справа —SDXL 0.9

Новая модель скоро будет доступна в веб-инструменте Clipdrop и появится в приложении DreamStudio. Версия SDXL 1.0 с открытым исходным кодом будет выпущена в середине июля.