Здравствуйте, друзья!
Недавно я рассказывал, как использовать FLUX.1 Kontext в ComfyUI и вскользь упомянул, что её можно запустить в Stable Diffusion WebUI-Forge. Тогда я не углублялся, потому что для видеокарт с памятью меньше 12 ГБ это было почти нереально — модель требовала слишком много ресурсов. Но теперь всё изменилось! Появилась квантованная версия FLUX.1 Kontext NF4, которая должна сносно работать даже на видеокартах с 4 ГБ видеопамяти. Сегодня я постараюсь описать как настроить эту модель в Forge, какие настройки помогут всё запустить без тормозов и как обойти проблемы.
Что такое FLUX.1 Kontext?
FLUX.1 Kontext — это мультимодальная модель для генерации и самое важное, редактирования изображений от Black Forest Labs, которая вышла в 2025 году. Она построена на архитектуре с 12 миллиардами параметров и заточена под сложные текстовые описания и контекстное редактирование.
Что она умеет:
- Редактирование на лету: Можно заменять фон, добавлять объекты, менять стиль, сохраняя исходный контекст. Это практически фотошоп, но с нейросетью! И как мне кажется даже Krita здесь даст шаг назад.
- Качество картинок: Полная версия (FP16) выдаёт невероятную детализацию и динамический диапазон. Но и квантованная NF4-версия тоже не подводит.
- Длинные описания: Модель понимает тексты до 512 токенов — это примерно 300–500 слов или 1500–2500 символов на русском.
- Квантование NF4: Позволяет запускать модель на слабых видеокартах с 4 ГБ видеопамяти — раньше такое было невозможно.
- Квантование GGUF: Так же позволит запускать модель на слабых видеокартах с небольшим объемом видеопамяти. Просмотреть все модели с различным квантованием можете здесь. Чем меньше индекс\цифра (Q8\6\4\2) указывающая битность квантования, тем меньше видеопамяти потребуется.
- Совместимость: Работает с Forge и ComfyUI, так что впишется в ваши проекты без лишних заморочек.
Установку Forge UI сегодня пожалуй пропущу — вы наверняка видели моё руководство в предыдущих статьях. Если нет, поищите, она точно есть. А я сосредоточусь на самой модели. Предполагаю, что Forge у вас стоит, и вы готовы запускать FLUX.1 Kontext.
Вот что нужно сделать:
- Скачиваем модель: Зайдите на Hugging Face и скачайте квантованную версию FLUX.1 Kontext NF4. Положите модель в папку webui/models/Stable-diffusion (или куда вы обычно складываете модели — у всех свои привычки).
- Добавляем обязательные файлы: Скачайте вариационный автоэнкодер (VAE) — файл ae.safetensors. Положите его в webui/models/VAE. Без этого файла модель не запустится, так что это обязательно!
Загрузите текстовые энкодеры: clip_l.safetensors и t5xxl_fp8_e4m3fn.safetensors. Их нужно поместить в webui/models/text_encoder. Эти файлы нужны, чтобы модель понимала ваши описания. - Запускаем Forge: В папке с Forge щёлкните дважды по run.bat. Откроется интерфейс в браузере, обычно по адресу http://localhost:7860.
- Устанавливаем расширение forge2_flux_kontext: Зайдите в Extensions - Install from URL и вставьте скопированную ссылку и нажмите Install. Дождитесь завершения установки и перезапустите интерфейс Apply and restart UI. При загрузке интерфейса вы обнаружите установленное расширение. Один немаловажный момент! Расширение постоянно будет дорабатываться автором, поэтому не ленитесь заглядывать на его страницу в поисках обновления. Хотя как мне кажется lllyasviel в ближайшем будущем допилит этот функционал в основной код Forge.
Настройка параметров в Forge практически не отличается от старого доброго Flux.1 и после запуска:
- В меню Checkpoint выберите вашу модель FLUX.1 Kontext NF4.
- Поставьте CFG Scale = 1. Негативные описания тут не работают, но есть Distilled CFG Guidance — обычно это значение 3.5, но для Flux.1 Kontext рекомендуются значения от 2.5 до 3.5.
- Sampler: Euler или Deis.
Schedule type: Simple или Beta.
Steps: 20-35.
Размер изображения: от 896x1152 - Используйте GPU Weights Slider в Forge, чтобы распределить нагрузку между видеокартой и процессором.
Для видеокарт с 4-6 ГБ видеопамяти
Квантование NF4 через библиотеку BitsandBytes сжимает модель, почти не теряя качества. У меня нет видеокарты с 4 ГБ, я тестировал на 4060 Ti с 8 ГБ — генерация без ускорений вроде TeaCache или SpeedWave заняла около 3 минут. На моей 3080 с 10 ГБ время варьируется от 1 минуты 20 секунд до 2 минут.
В сети уже много информации о том, что на 4 ГБ видеопамяти картинка генерируется примерно за 5 минут. И помогает в этом квантование NF4. Оно снижает потребление памяти примерно на 50% по сравнению с FP8 и ускоряет генерацию в 1.3–4 раза.
GPU Weights Slider: В Forge настройте слайдер, чтобы выгрузить часть модели на CPU. Начните с усреднённых значений и потестируйте, чтобы не было сбоев.
Методы свопинга:
Queue Method: Слои обрабатываются по очереди — надёжный вариант для слабых видеокарт.
Выгрузка на CPU или общую память: CPU — стабильный вариант, но медленнее. Общая память на 15% быстрее, но могут возникать ошибки. Пробуйте оба, чтобы найти стабильный вариант для своей конфигурации.
Уменьшение размера изображения: Начните с 512x512. Большие размеры могут затянуть генерацию надолго или вовсе крашнуть.
GGUF как запасной вариант: Если NF4 не тянет, попробуйте GGUF-модель, например Q2 или Q4. Ссылку на страницу квантованных моделей я давал выше.
В случаях когда эти манипуляции не помогают и вы сталкиваетесь с нехваткой памяти, ошибками и вылетами в Forge есть стандартное решение проблемы. Инструмент называется Never OOM Integrated в котором ничего не нужно делать кроме того как поставить 2 галочки. Время генерации увеличится и ощутимо но в большинстве случаев ваше изображение сгенерируется без ошибок и вылетов. Можно попробовать установить расширение TeaCache или First Block Cache и попытаться ускорить генерацию, но насколько это вам поможет не могу сказать. Но думаю попробовать стоит.
Установить вы его сможете отсюда, так же как и любое другое расширение для Forge UI.
С загрузками и настройками мы закончили, теперь перейдем к генерации и редактированию изображений.
Для стандартной генерации с этой моделью расширение не нужно. Вы сможете создавать изображения так же, как и с любой другой моделью.
Но для редактирования изображений потребуется расширение, которое мы уже установили.
Открываем окно расширения - загружаем необходимое изображение для редактирования - пишем промпт исходя их нашей хотелки.
Чтобы контролировать процесс генерации и видеть результаты, не тратя время на полную генерацию, настройте параметры в разделе "Настройки" (Settings). Перейдите в "Пользовательский интерфейс" (User interface) и выберите "Предварительный просмотр в реальном времени" (Live preview). Установите параметр "Период отображения предварительного просмотра" (Live preview display period) на 1. Это позволит вам наблюдать за прогрессом каждого шага генерации и если вы видите что все пошло НЕТаК то сразу жмите Interrupt чтобы не терять время на неправильную генерацию.
Ну и пока мы занимались с вами настройкой предпросмотра генерации, у нас получился вот такой вот король фастфуда по запросу: "одень корону на голову персонажа"
Если вы собираетесь делать множественное издевательство над изображением, то пока в расширении не реализован функционал копирования сгенерированного изображения в окно расширения, и быстро это можно сделать, только скопировав изображение:
И вставив его через Ctrl + V. Если вдруг изображение появится не в том окне, не страшно, но если очень нужно, то просто поменяйте местами, нажав на 2 стрелки в расширении.
Что важно при множественном редактировании. Конечно, правильность запроса. Например, я хочу одеть нашего "короля фастфуда" в какую-то обувь, и если я это опишу вот так вот просто: «одень на тигра королевскую обувь», то модель поймет меня буквально и бесцеремонно выпилит всё, что будет мешать ей в выполнении поставленной задачи. :
НО если мы ткнем её носом в промпте на «Одень на персонажа королевскую обувь, сохранив все объекты на изображении», то она поймет, что нужно всё оставить как есть:
Ничего сложного. Надеюсь, я хоть на примитивном уровне объяснил, как нужно с ней общаться, чтобы получить желаемый результат.
Теперь давайте попробуем поработать с двумя разными изображениями и попробуем их объединить. У нас есть наша "королевская особа", и давайте добавим любого персонажа.
Ну и теперь нужно написать промпт, давайте попробуем устроить им обнимашки: "на изображении 2 персонажа, девушка обнимает тигра"
Результат получился вполне удовлетворительным. Вы можете продолжать экспериментировать с изображением, пока оно не будет соответствовать вашим ожиданиям. Важно научиться четко формулировать свои требования к модели.
На мой взгляд, квантованная модель работает отлично. Я не заметил существенных различий между NF4 и FP8 после создания нескольких сотен изображений. Эти различия невелики и не критичны, особенно учитывая высокую скорость генерации картинок.
В принципе я дал вам все необходимое для начала работы с моделью в интерфейсе. Остался только один момент — запросы. Давайте немного поговорим о них.
Промпты для FLUX.1 Kontext
FLUX.1 Kontext как вы уже поняли это не просто про генерацию картинок с нуля, она заточена под редактирование изображений с учётом контекста. Она позволяет восстанавливать старые фото, убирать лишние объекты, менять фон, переодевать персонажей, стилизовать изображения и даже работать с текстом. Чтобы вы поняли, как с ней работать, я собрал небольшой список примеров запросов, основанных на реальных задачах.
Советы по запросам:
- Пишите чётко, что менять: “replace” (заменить), “add” (добавить), “remove” (удалить), “transform” (преобразовать).
- Указывайте, что сохранить: “keep the original lighting” (сохранить освещение), “maintain the same composition” (сохранить композицию).
- Для текста используйте кавычки: “replace ‘Open’ with ‘Closed’”.
- Называйте конкретные стили: “watercolor painting” (акварель), “cinematic style” (кинематографический стиль).
- Начинайте с простых правок и постепенно усложняйте.
Примеры промптов
1. Восстановление старых фотографий
- “Restore an old black-and-white photo to full color, fix scratches and faded areas, keep the original composition and details.”
(Восстановите старую чёрно-белую фотографию в цвете, уберите царапины и выцветшие участки, сохраните исходную композицию и детали.)
- “Enhance an aged photo, remove noise and stains, add natural colors, maintain the original subject and background.”
(Улучшите старую фотографию, уберите шум и пятна, добавьте естественные цвета, сохраните исходный объект и фон.) - “Revive a damaged vintage photo, repair tears, restore sharpness, keep the original person’s appearance.”
(Оживите повреждённое винтажное фото, исправьте разрывы, восстановите чёткость, сохраните внешний вид человека.)
2. Удаление водяных знаков
- “Remove the watermark from the bottom right corner, keep the rest of the image unchanged.”
(Удалите водяной знак, сохраните остальное изображение без изменений.)
- “Erase the text watermark across the center, preserve the scene’s details and colors.”
(Сотрите текстовый водяной знак в центре, сохраните детали и цвета сцены.) - “Clean the image from any watermarks, ensure the background and subject remain intact.”
(Очистите изображение от любых водяных знаков, сохраните фон и объект без изменений.)
3. Удаление людей
- “Remove all people from the background, keep the main subject and scene unchanged.”
(Удалите всех людей с фона, сохраните главный объект и сцену без изменений.)
- “Erase the crowd in the background, maintain the foreground person and lighting.”
(Сотрите толпу на заднем плане, сохраните человека на переднем плане и освещение.) - “Delete the person on the left side, keep the rest of the composition and details intact.”
(Удалите человека слева, сохраните остальную композицию и детали без изменений.)
4. Удаление объектов
- “Remove the donkey from the scene, keep the landscape and lighting unchanged.”
(Удалите ослика из сцены, сохраните пейзаж и освещение без изменений.)
- “Erase the sword from the character’s hand, maintain the pose and background.”
(Сотрите меч из руки персонажа, сохраните позу и фон.) - “Delete the wires crossing the sky, keep the rest of the image intact.”
(Удалите провода, пересекающие небо, сохраните остальное изображение без изменений.)
5. Замена фона
- “Replace the background with the Roman Colosseum in daylight, keep the person in the foreground unchanged, match the lighting.”
(Замените фон на римский Колизей, сохраните человека на переднем плане без изменений, согласуйте освещение.)
- “Change the background to a snowy forest, maintain the subject’s position and original lighting.”
(Замените фон на заснеженный лес, сохраните положение объекта и исходное освещение.) - “Swap the background for a futuristic city with skyscrapers, keep the main character and composition intact.”
(Замените фон на футуристический город со небоскрёбами, сохраните главного персонажа и композицию.)
6. Переодевание персонажей
- “Change the girl’s outfit to a black leather jacket, keep her pose and background unchanged.”
(Измените одежду девушки на чёрную кожаную куртку, сохраните позу и фон без изменений.)
- “Replace the character’s shirt with a plaid jacket, maintain the original scene and lighting.”
(Замените рубашку персонажа на клетчатую куртку, сохраните исходную сцену и освещение.) - “Dress the person in a medieval knight’s armor, keep the face and background intact.”
(Оденьте человека в доспехи средневекового рыцаря, сохраните лицо и фон без изменений.)
7. Раскрашивание и стилизация
- “Colorize a black-and-white photo, add natural colors to the scene, keep the original contours and details.”
(Раскрасьте чёрно-белую фотографию, добавьте естественные цвета, сохраните исходные контуры и детали.)
- “Apply a cinematic style with soft lighting, maintain the original subject’s face and composition.”
(Примените кинематографический стиль с мягким освещением, сохраните лицо и композицию объекта.) - “Transform the image into an anime style, keep the character’s pose and background recognizable.”
(Преобразуйте изображение в аниме-стиль, сохраните позу персонажа и узнаваемый фон.) - “Turn the photo into a child’s drawing style, maintain the main subject and layout.”
(Преобразуйте фотографию в стиль детского рисунка, сохраните главный объект и макет.)
- “Age the photo to look like an old sepia image with scratches, keep the original subject intact.”
(Состарьте фотографию, чтобы она выглядела как старая сепия с царапинами, сохраните исходный объект.)
8. Замена объектов
- “Replace the lamp with a glowing glass orb, keep the room’s lighting and furniture unchanged.”
(Замените лампу на светящийся стеклянный шар, сохраните освещение и мебель комнаты.)
- “Swap the bicycle with a hoverboard, maintain the original street scene and shadows.”
(Замените велосипед на ховерборд, сохраните исходную уличную сцену и тени.) - “Change the vase to a bronze statue, keep the table and background intact.”
(Замените вазу на бронзовую статую, сохраните стол и фон без изменений.)
9. Перенос персонажа
- “Move the character to a snowy alpine village, add a lantern in their hand, keep their original attire.”
(Перенесите персонажа в заснеженную альпийскую деревню, добавьте фонарь в руку, сохраните исходный наряд.)
- “Place the figure in a neon-lit arcade, maintain their original posture and lighting.”
(Разместите фигуру в аркаде с неоновым освещением, сохраните исходную позу и освещение.) - “Transfer the person to a rooftop garden at night, keep their appearance and shadows unchanged.”
(Перенесите человека в сад на крыше ночью, сохраните их внешний вид и тени.)
10. Работа с текстом
- “Change the text on the storefront from ‘Bakery’ to ‘Café’, maintain the same font and lighting.”
(Измените текст на витрине с ‘Bakery’ на ‘Café’, сохраните шрифт и освещение.)
- “Remove the word ‘Store’ from the sign, keep the rest of the design and colors unchanged.”
(Удалите слово ‘Store’ с вывески, сохраните остальной дизайн и цвета без изменений.) - “Replace the text on the menu from ‘Lunch’ to ‘Dinner’, match the original typography.”
(Замените текст на меню с ‘Lunch’ на ‘Dinner’, согласуйте с исходной типографикой.)
11. Конкретизация цвета
- “Change the blue hat to a red one, keep the person’s outfit and background intact.”
(Замените синюю шляпу на красную, сохраните наряд человека и фон.)
12. Комплексные изменения
- “Replace the background with a misty bamboo forest, add a stone lantern on the right, apply a sumi-e ink painting style, keep the original lighting.”
(Замените фон на туманный бамбуковый лес, добавьте каменный фонарь справа, примените стиль живописи суми-э, сохраните освещение.)
- “Remove the pedestrians, add a vintage tram in the center, transform the scene into a retro postcard style, maintain the original shadows.”
(Удалите пешеходов, добавьте винтажный трамвай в центр, преобразуйте сцену в стиль ретро-открытки, сохраните тени.) - “Change the daytime scene to a starry night, add floating lanterns, apply a pastel art style, keep the original subject.”
(Измените дневную сцену на звёздную ночь, добавьте парящие фонари, примените пастельный стиль, сохраните объект.)
Советы по работе:
- Проверяйте разрешение и пропорции, чтобы избежать обрезки изображений при редактировании.
- Для сложных правок делайте их поэтапно: сначала уберите объект, потом замените фон.
- Если результат не идеален, попробуйте уточнить промпт или использовать LoRA для стилизации.
Это далеко не все примеры запросов. Но они показывают, как FLUX.1 Kontext справляется с реальными задачами редактирования. Пробуйте, экспериментируйте, и пишите свои варианты запросов в комментариях!
Как итог
Квантованные модели FLUX.1 Kontext в форматах NF4 и GGUF в Forge UI дают реальный но конечно не 100 процентный шанс попробовать работу модели на видеокартах с 4-6 ГБ видеопамяти. Но судя по отзывам пользователей с использованием этих моделей и правильными настройками даже слабая видеокарта должна справится.
Ну и конечно же, если вам понравилась эта статья, буду рад вашим подпискам, комментариям и лайкам. Недавно я запустил Discord-канал и постараюсь поддерживать его насколько возможно, там вы сможете не только следить за новостями, но и общаться, делиться опытом и приобретать новые знания о нейросетях. Чтобы всегда быть в курсе моих новых материалов, подписывайтесь на мой Boosty, Telegram-канал и страницу "ВКонтакте". Пока что нас немного, но я надеюсь, что с течением времени сообщество станет больше. Это станет отличной мотивацией для меня активно работать и над другими социальными сетями.