Сегодня мы разберёмся с весовыми коэффициентами в Fooocus. Это поможет нам лучше понять, как управлять непокорными нейросетями и добиваться желаемых результатов.
При генерации изображений с помощью текстовых подсказок (prompts) в Fooocus часто возникает необходимость усилить или уменьшить влияние тех или иных токенов, чтобы добиться более точного результата. Fooocus позволяет управлять влиянием отдельных слов или фраз в запросах, используя весовые коэффициенты.
И прежде чем мы приступим, не забудьте подписаться на мой телеграм-канал. Там я делюсь настройками для Fooocus и с радостью общаюсь с вами в комментариях 👇
Чтобы наглядно продемонстрировать, как использование весов может повлиять на результат, давайте рассмотрим несколько примеров из предыдущего урока, посвященного правильному и простому написанию запросов в Fooocus 👇
Вы можете заметить, что при добавлении токенов в предыдущем уроке стиль баухаус стал менее выраженным, хотя и сохраняет некоторые его черты. Давайте попробуем исправить это, используя веса. Напомню запрос и получаемые с помощью него результаты 👇
illustration in bauhaus style, the cat in the human hat, colorful circus background, he holds a magic wand in his paw
Итак, чтобы изменить вес токена «illustration in bauhaus style», необходимо выделить его в окне запроса, затем, удерживая клавишу «ctrl», увеличить или уменьшить вес с помощью кнопок «вверх» и «вниз». То же самое касается и отрицательных подсказок 👇
Здесь запись «(illustration in bauhaus style:1.5)» указывает на то, что токен «illustration in bauhaus style» будет оказывать на итоговое изображение в 1.5 раза большее влияние по сравнению с другими словами.
(illustration in bauhaus style:1.5), the cat in the human hat, colorful circus background, he holds a magic wand in his paw
Хотя мы и достигли желаемого результата, он всё же не совсем меня устраивает. Я постараюсь поработать над ним и, возможно, уменьшить его вес.
(illustration in bauhaus style:0.5), the cat in the human hat, colorful circus background, he holds a magic wand in his paw
Влияние токена уменьшилось и этот результат мне гораздо больше нравится Приведенные примеры помогут лучше понять, как весовые коэффициенты токенов изменяют визуальный акцент в генерируемом изображении.
Применение весов в текстовых подсказках для Fooocus делает процесс генерации изображений более управляемым и прогнозируемым. Благодаря настройке весов можно точнее контролировать влияние каждого отдельного элемента запроса, что, в свою очередь, способствует улучшению качества результатов. Например, это может быть полезно в сочетании с методами, которые борются с похожестью лиц.
Кстати, весовые коэффициенты работают и с ключевыми словами для LoRA и Embedding. Читайте о них в данных статьях 👇