Stability AI представила модель для генерации изображений по текстовому описанию Stable Diffusion 3 Medium, сообщает Tweakers. Medium — это «облегчённая» версия модели с двумя миллиардами параметров, которой достаточно 5 ГБ видеопамяти для работы (хотя компания всё же рекомендует 16 ГБ), т.е. модель можно успешно запускать на большинстве современных потребительских видеокарт. Кроме этого сообщается, что модель была оптимизирована при участии AMD для запуска на графических решениях компании корпоративного и потребительского уровня, включая APU, а для владельцев видеокарт NVIDIA предоставляется модель, оптимизированная с помощью TensorRT.
Примеры промтов и результат генерации в Stable Diffusion 3 Medium. Источник изображения: Stability AI.
Stability AI выпускает Stable Diffusion 3 Medium под лицензией Stability Non-Commercial Research Community License для некоммерческого использования, для использования в коммерческих целях предлагаются платные лицензии: лимитированная для создателей контента обойдётся от 20 долларов США в месяц, а стоимость лицензий для бизнеса обговаривается в индивидуальном порядке.
Ранее Stability AI заявила, что в Stable Diffusion 3 компания впервые использует комбинация архитектур диффузионного трансформатора и согласования потоков, что, в частности, должно значительно ускорить генерацию, пишет Tweakers.