Найти в Дзене
Neuro-сеть

SUPIR: Полное руководство по генеративному апскейлу на базе SDXL

Приветствую! SUPIR (Scaling-UP Image Restoration) — это мощнейшая платформа с открытым исходным кодом для восстановления и фотореалистичного масштабирования изображений. Разработанный как Open Source ответ платным сервисам вроде Magnific AI, SUPIR использует модели SDXL и модели анализа изображений, чтобы интеллектуально перерисовывать и детализировать картинку на основе её содержимого и текстовых подсказок. Важно понимать: SUPIR — это не классический апскейлер, который просто увеличивает количество пикселей. Это генеративная модель, которая смотрит на ваше изображение, анализирует его с помощью CLIP/LLaVA, создает внутреннее описание и затем рисует новую, высокодетализированную версию на основе этого понимания. Это открывает огромные возможности для творчества, но также требует более вдумчивого подхода к настройкам. Версии модели: Технические детали и требования (VRAM): Установка для ComfyUI: Рабочий процесс (Workflow) и ключевые настройки: Во первых есть уже готовые рабочие процессы,
Оглавление

Приветствую!

SUPIR (Scaling-UP Image Restoration) — это мощнейшая платформа с открытым исходным кодом для восстановления и фотореалистичного масштабирования изображений. Разработанный как Open Source ответ платным сервисам вроде Magnific AI, SUPIR использует модели SDXL и модели анализа изображений, чтобы интеллектуально перерисовывать и детализировать картинку на основе её содержимого и текстовых подсказок.

Не апскейлер, а "ре-генератор"

Важно понимать: SUPIR — это не классический апскейлер, который просто увеличивает количество пикселей. Это генеративная модель, которая смотрит на ваше изображение, анализирует его с помощью CLIP/LLaVA, создает внутреннее описание и затем рисует новую, высокодетализированную версию на основе этого понимания. Это открывает огромные возможности для творчества, но также требует более вдумчивого подхода к настройкам.

Пример
Пример

Версии модели:

  • SUPIR-v0Q: Основная, универсальная версия. Лучший выбор для большинства задач, особенно для восстановления изображений с заметными искажениями или артефактами.
  • SUPIR-v0F: Специализированная версия для деликатной работы. Используется для изображений с уже хорошим исходным качеством, когда ключевая задача — сохранить оригинальные детали и композицию с минимальными изменениями.
-2

Технические детали и требования (VRAM):

  • Модель требовательна к ресурсам. Потребление VRAM напрямую зависит от разрешения.
  • 10-12 ГБ VRAM: Позволяет комфортно работать с увеличением 2x (например, с 768p до 1536p).
  • 16-24 ГБ VRAM: Необходимо для работы с высоким разрешением (апскейл до 3K-4K) и более сложными воркфлоу.
  • Оптимизация: Для экономии VRAM можно использовать Tiled VAE и FP8 кодирование для Unet. Это позволяет выполнять масштабные задачи на картах с <16 ГБ VRAM, но значительно увеличивает нагрузку на системную память (RAM), которой рекомендуется иметь не менее 32-64 ГБ.
-3

Установка для ComfyUI:

  1. Установите ComfyUI-Manager для удобного управления кастомными нодами.
  2. Установите кастомный узел: Через менеджер найдите и установите ComfyUI-SUPIR от автора kijai. Если не нашли - его страница тут.
  3. Скачайте необходимые модели:
    Модели SUPIR:
    Скачайте SUPIR-v0F.pt и SUPIR-v0Q.pt и поместите их в папку ComfyUI/models/supir.
    Модель SDXL Base: Требуется базовая модель, например, sd_xl_base_1.0.safetensors. Поместите ее в ComfyUI/models/checkpoints.
    Модель LLaVA: Скачайте llava-v1.5-13b и поместите в ComfyUI/models/clip_vision. Эта модель нужна для автоматического анализа изображения.
    Модель CLIP Vision: Скачайте CLIP-ViT-H-14-laion2B-s32B-b79K.safetensors и также поместите в ComfyUI/models/clip_vision.
  4. Перезапустите ComfyUI после установки всех компонентов.

Рабочий процесс (Workflow) и ключевые настройки:

Во первых есть уже готовые рабочие процессы, вот например и вот пожалуйста

  • Загрузка: Самый простой способ начать — перетащить готовый JSON-файл с воркфлоу на холст ComfyUI. Качественные примеры доступны на таких ресурсах, как Civitai или в репозитории ComfyUI-SUPIR.
  • Позитивный промпт: Это ваша главная точка контроля. Здесь вы можете уточнить детали, которые модель LLaVA могла упустить, или направить генерацию в нужную сторону. Используйте фразы для повышения качества: photorealistic, ultra-detailed, 4k, sharp focus.
  • Негативный промпт: Не менее важен. Обязательно добавляйте сюда blurry, artifact, jpeg artifact, low quality, bad quality, deformed, disfigured, чтобы избежать распространенных проблем.
  • s_noise (уровень шума): Самый важный параметр для контроля креативности.
    0: Максимально близко к оригиналу. Используйте для деликатного апскейла.
    0.1 - 0.3: Небольшая творческая свобода, добавление мелких деталей. Хороший старт для большинства изображений.
    0.4 - 0.7: Значительная переработка изображения. Может сильно изменить оригинал, но и создать впечатляющие детали "из ничего".
  • steps (шаги) и cfg: Начните со значений 20-30 для шагов и 5-7 для CFG. Высокие значения CFG могут сделать изображение слишком "пережаренным" и контрастным.
Пример воркфлоу
Пример воркфлоу

Советы:

  • Сначала промпт, потом апскейл: Вместо того чтобы сразу увеличивать изображение в 4 раза, попробуйте сначала запустить процесс с 1x увеличением. Это позволит вам быстро подобрать идеальный промпт и s_noise, не тратя ресурсы. Когда результат вас устроит, используйте те же настройки для финального 2x или 4x апскейла.
  • LLaVA не всесильна: Модель анализа изображений хороша, но не идеальна. Если вы видите, что SUPIR неправильно интерпретирует важную деталь (например, логотип на футболке или текст), обязательно опишите эту деталь в позитивном промпте.
  • Проблема с лицами: Как и многие модели на базе SDXL, SUPIR может искажать лица на общих планах. Если лица в приоритете, используйте двухэтапный процесс: сначала общий апскейл с помощью SUPIR, а затем прогоните результат через специализированный воркфлоу для восстановления лиц (Face Detailer / CodeFormer).
  • Меньше — лучше: Не всегда нужно выкручивать s_noise на максимум. Часто лучший результат достигается при минимальном, но достаточном уровне шума, который просто "освежает" текстуры, не меняя суть изображения.
  • Негативный промпт для сохранения стиля: Если вы хотите сохранить мультяшный или аниме-стиль, добавьте в негативный промпт photorealistic, realism, чтобы модель не пыталась сделать изображение реалистичным.

Интеграция с Forge WebUI:

  • На данный момент нативная поддержка отсутствует. Существовавший репозиторий для интеграции заархивирован, и официального решения нет. Пользователям Forge рекомендуется использовать ComfyUI для доступа к полному функционалу SUPIR.

Cпасибо, что дочитали до конца! 🙏

Буду рад вашим комментариям🎤, лайкам🧡 и подпискам на мой канал:

Neuro-сеть | Дзен

Так же заходите в мою группу в VK и на канал Телеграм.