Приветствую!
SUPIR (Scaling-UP Image Restoration) — это мощнейшая платформа с открытым исходным кодом для восстановления и фотореалистичного масштабирования изображений. Разработанный как Open Source ответ платным сервисам вроде Magnific AI, SUPIR использует модели SDXL и модели анализа изображений, чтобы интеллектуально перерисовывать и детализировать картинку на основе её содержимого и текстовых подсказок.
Не апскейлер, а "ре-генератор"
Важно понимать: SUPIR — это не классический апскейлер, который просто увеличивает количество пикселей. Это генеративная модель, которая смотрит на ваше изображение, анализирует его с помощью CLIP/LLaVA, создает внутреннее описание и затем рисует новую, высокодетализированную версию на основе этого понимания. Это открывает огромные возможности для творчества, но также требует более вдумчивого подхода к настройкам.
Версии модели:
- SUPIR-v0Q: Основная, универсальная версия. Лучший выбор для большинства задач, особенно для восстановления изображений с заметными искажениями или артефактами.
- SUPIR-v0F: Специализированная версия для деликатной работы. Используется для изображений с уже хорошим исходным качеством, когда ключевая задача — сохранить оригинальные детали и композицию с минимальными изменениями.
Технические детали и требования (VRAM):
- Модель требовательна к ресурсам. Потребление VRAM напрямую зависит от разрешения.
- 10-12 ГБ VRAM: Позволяет комфортно работать с увеличением 2x (например, с 768p до 1536p).
- 16-24 ГБ VRAM: Необходимо для работы с высоким разрешением (апскейл до 3K-4K) и более сложными воркфлоу.
- Оптимизация: Для экономии VRAM можно использовать Tiled VAE и FP8 кодирование для Unet. Это позволяет выполнять масштабные задачи на картах с <16 ГБ VRAM, но значительно увеличивает нагрузку на системную память (RAM), которой рекомендуется иметь не менее 32-64 ГБ.
Установка для ComfyUI:
- Установите ComfyUI-Manager для удобного управления кастомными нодами.
- Установите кастомный узел: Через менеджер найдите и установите ComfyUI-SUPIR от автора kijai. Если не нашли - его страница тут.
- Скачайте необходимые модели:
Модели SUPIR: Скачайте SUPIR-v0F.pt и SUPIR-v0Q.pt и поместите их в папку ComfyUI/models/supir.
Модель SDXL Base: Требуется базовая модель, например, sd_xl_base_1.0.safetensors. Поместите ее в ComfyUI/models/checkpoints.
Модель LLaVA: Скачайте llava-v1.5-13b и поместите в ComfyUI/models/clip_vision. Эта модель нужна для автоматического анализа изображения.
Модель CLIP Vision: Скачайте CLIP-ViT-H-14-laion2B-s32B-b79K.safetensors и также поместите в ComfyUI/models/clip_vision. - Перезапустите ComfyUI после установки всех компонентов.
Рабочий процесс (Workflow) и ключевые настройки:
Во первых есть уже готовые рабочие процессы, вот например и вот пожалуйста
- Загрузка: Самый простой способ начать — перетащить готовый JSON-файл с воркфлоу на холст ComfyUI. Качественные примеры доступны на таких ресурсах, как Civitai или в репозитории ComfyUI-SUPIR.
- Позитивный промпт: Это ваша главная точка контроля. Здесь вы можете уточнить детали, которые модель LLaVA могла упустить, или направить генерацию в нужную сторону. Используйте фразы для повышения качества: photorealistic, ultra-detailed, 4k, sharp focus.
- Негативный промпт: Не менее важен. Обязательно добавляйте сюда blurry, artifact, jpeg artifact, low quality, bad quality, deformed, disfigured, чтобы избежать распространенных проблем.
- s_noise (уровень шума): Самый важный параметр для контроля креативности.
0: Максимально близко к оригиналу. Используйте для деликатного апскейла.
0.1 - 0.3: Небольшая творческая свобода, добавление мелких деталей. Хороший старт для большинства изображений.
0.4 - 0.7: Значительная переработка изображения. Может сильно изменить оригинал, но и создать впечатляющие детали "из ничего". - steps (шаги) и cfg: Начните со значений 20-30 для шагов и 5-7 для CFG. Высокие значения CFG могут сделать изображение слишком "пережаренным" и контрастным.
Советы:
- Сначала промпт, потом апскейл: Вместо того чтобы сразу увеличивать изображение в 4 раза, попробуйте сначала запустить процесс с 1x увеличением. Это позволит вам быстро подобрать идеальный промпт и s_noise, не тратя ресурсы. Когда результат вас устроит, используйте те же настройки для финального 2x или 4x апскейла.
- LLaVA не всесильна: Модель анализа изображений хороша, но не идеальна. Если вы видите, что SUPIR неправильно интерпретирует важную деталь (например, логотип на футболке или текст), обязательно опишите эту деталь в позитивном промпте.
- Проблема с лицами: Как и многие модели на базе SDXL, SUPIR может искажать лица на общих планах. Если лица в приоритете, используйте двухэтапный процесс: сначала общий апскейл с помощью SUPIR, а затем прогоните результат через специализированный воркфлоу для восстановления лиц (Face Detailer / CodeFormer).
- Меньше — лучше: Не всегда нужно выкручивать s_noise на максимум. Часто лучший результат достигается при минимальном, но достаточном уровне шума, который просто "освежает" текстуры, не меняя суть изображения.
- Негативный промпт для сохранения стиля: Если вы хотите сохранить мультяшный или аниме-стиль, добавьте в негативный промпт photorealistic, realism, чтобы модель не пыталась сделать изображение реалистичным.
Интеграция с Forge WebUI:
- На данный момент нативная поддержка отсутствует. Существовавший репозиторий для интеграции заархивирован, и официального решения нет. Пользователям Forge рекомендуется использовать ComfyUI для доступа к полному функционалу SUPIR.
Cпасибо, что дочитали до конца! 🙏
Буду рад вашим комментариям🎤, лайкам🧡 и подпискам на мой канал: