Вышла новая версия Stable Diffusion, которая позволяет генерировать изображения по текстовому описанию. В сборке SDXL 0.9 разработчики значительно улучшили качество получаемых картинок, поработав над их детализацией и композицией. Заодно был исправлен самый известный недочёт фирменного алгоритма, породивший бесчисленное количество мемов.
Одним из главных нововведений стала корректная прорисовка пальцев рук человека: раньше алгоритм испытывал серьёзные проблемы с такими изображениями. Разработчики опубликовали примеры картинок, созданных по одному и тому же описанию в стабильной бета-версии Diffusion XL и новой SDXL 0.9 — в последнем случае результаты генерации выглядят более реалистично.
В компании отмечают, что улучшить работу нейросети позволило значительное увеличение количества параметров новой модели. Для локального запуска SDXL 0.9 на ПК потребуется минимум 16 ГБ оперативной памяти и видеокарта серии GeForce RTX 20 (или выше) хотя бы с 8 ГБ видеопамяти.
Новая модель скоро будет доступна в веб-инструменте Clipdrop и появится в приложении DreamStudio. Версия SDXL 1.0 с открытым исходным кодом будет выпущена в середине июля.