Привет, друзья!
Сегодня я хочу рассказать вам о VisoMaster — проекте, который делает замену лиц в видео и изображениях проще и доступнее для всех. Это open-source решение, которое работает на Windows и Linux и подходит как для творческих экспериментов, так и для знакомства с технологиями deepfake. Хотите попробовать себя в роли видеомонтажёра или узнать, как работают нейросети? Давайте разберём, что это за инструмент, чем он примечателен и как его установить.
Что такое VisoMaster?
VisoMaster — это проект на GitHub (https://github.com/visomaster/VisoMaster), созданный энтузиастами, включая @argenspin и @Alucard24. Он позволяет загружать видео или фото, выбирать любое лицо для замены и получать результат с помощью нейросетей. Всё интуитивно: добавляете материалы, настраиваете параметры, запускаете обработку. Проект поддерживает разные форматы файлов, корректно работает с русскими буквами в путях (с версии v0.1.3), а в последних обновлениях (v0.1.5) появилась возможность передавать результат на виртуальную камеру — например, для стримов в OBS.
VisoMaster вырос из популярного редактора Rope и его ответвления RopeMod. Оригинальный Rope давно не обновлялся — разработчик не выпускал новых версий уже наверное более полугода. Сообщество решило взять дело в свои руки и создало своего рода "переосмысление" проекта. VisoMaster унаследовал ключевые возможности RopeMod, такие как детальная настройка масок и поддержка видео с веб-камеры, но при этом стал быстрее и удобнее. Интерфейс теперь отзывчивее, можно работать не только с папками, но и с отдельными файлами, а некоторые инструменты заметно ускорились. В будущем, возможно, добавят и новые функции — разработка продолжается.
Для чего нужен VisoMaster.
VisoMaster открывает простор для творчества. С ним можно создавать забавные ролики с заменой лиц, делать уникальные аватарки или экспериментировать с видео. Стримеры оценят интеграцию с виртуальной камерой — представьте, как ведёте эфир с другим лицом в реальном времени. А для тех, кто только начинает знакомство с нейросетями, это удобный способ увидеть их работу без глубокого погружения в технические детали.
Как установить VisoMaster.
Установка зависит от вашей системы. Для Windows есть простой автоматический вариант, а для Linux или желающих настроить всё вручную — более гибкий подход.
Вот как это сделать:
Как установить VisoMaster для Windows:
1. Перейдите на страницу релизов VisoMaster (https://github.com/visomaster/VisoMaster/releases) и скачайте последнюю версию программы на февраль 2025 года — v0.1.5. Для этой версии доступна портативная версия в формате архива (.zip). Скачайте файл, но обратите внимание: портативная версия не содержит встроенного выбора версии CUDA. Убедитесь, что на вашем компьютере уже установлена совместимая версия CUDA, соответствующая вашей видеокарте NVIDIA:
Для видеокарт серии 10xx (например, GTX 1080) используйте CUDA 11.8.
Для видеокарт серии 20xx и выше (например, RTX 2080 или новее) используйте CUDA 12.4.
Проверьте, что у вас установлены актуальные драйверы NVIDIA, совместимые с выбранной версией CUDA (информацию о минимальных версиях драйверов можно найти в документации CUDA или на сайте NVIDIA).
Распакуйте скачанный архив в удобное место на вашем компьютере — например, в папку на диске C: или D:. Для этого используйте любой архиватор, такой как WinRAR, 7-Zip или встроенные средства Windows.
После распаковки откройте папку с программой и найдите файл Start_Portable.bat. Дважды щёлкните по нему, чтобы запустить VisoMaster. В процессе запуска скачаются необходимые для работы зависимости и модели. Интерфейс программы откроется, и вы сможете приступить к работе.
Примечание: Портативная версия не требует установки и автоматически использует уже установленную версию CUDA. Если возникают ошибки, связанные с CUDA (например, несовместимость версий), проверьте, что ваша видеокарта и драйверы поддерживают выбранную версию CUDA, и обновите их при необходимости.
2. Упрощённый вариант для новичков (альтернатива): Если вы не уверены, как установить или проверить правильную версию CUDA для портативной версии, вы можете использовать более раннюю версию VisoMaster — v0.1.1, где доступен установочный файл (.exe). Вот как это сделать:
Перейдите на страницу релизов (https://github.com/visomaster/VisoMaster/releases), найдите версию v0.1.1 и скачайте установочный файл (.exe).
Запустите установщик, следуйте инструкциям и в процессе установки выберите подходящую версию CUDA для вашей видеокарты:
CUDA 11.8 для видеокарт серии 10xx (например, GTX 1080).
CUDA 12.4 для видеокарт серии 20xx и выше (например, RTX 2080 или новее).
После установки откройте папку с программой, найдите файл Update_Portable.bat и запустите его, чтобы обновить проект до актуальной версии (v0.1.5 на февраль 2025 года). Затем найдите файл Start_Portable.bat и запустите программу.
3. Для продвинутых пользователей (Windows/Linux):
Хотите собрать VisoMaster самостоятельно или установить на Linux?
Все шаги подробно описаны в README на странице проекта (https://github.com/visomaster/VisoMaster). Там есть инструкции по работе с Git, Miniconda, Python 3.10.13 и нужными библиотеками. Это требует больше времени и знаний, но позволяет гибко настроить программу под себя.
Если что-то не запускается — например, из-за CUDA или отсутствия моделей, — обновите драйверы GPU и проверьте, всё ли зависимости установлены корректно.
Для Windows автоматический установщик обычно решает большинство вопросов.
Теперь о самом интерфейсе и работе с ним. Для тех, кто не знаком с ним и не понимает, что означают все эти параметры и значения, я хочу облегчить вам задачу. Чтобы вы не тратили время на эксперименты и не искали решение методом проб и ошибок, ниже я предоставлю описание функций и возможностей каждого пункта меню несущего в себе полезную смысловую нагрузку.
Краткое описание функций меню "File".
- Load Saved Workspace: Загружает сохранённое рабочее пространство с настройками и файлами.
- Save Current Workspace: Сохраняет текущие настройки и загруженные файлы в рабочее пространство.
- Save Current Workspace As: Сохраняет рабочее пространство под новым именем или в другом месте.
- Load Target Images/Videos Folder: Загружает папку с целевыми изображениями/видео для замены лиц.
- Load Target Image/Video Files: Позволяет выбрать отдельные целевые файлы (изображения/видео).
- Load Source Images Folder: Загружает папку с исходными изображениями для обработки.
- Load Source Image Files: Позволяет выбрать отдельные исходные изображения.
- Load Embeddings: Загружает заранее сохранённые данные распознавания лиц (для продвинутых пользователей).
- Save Embeddings: Сохраняет данные распознавания лиц для повторного использования.
- Save Embeddings As: Сохраняет данные распознавания лиц под новым именем или в другом месте.
Краткое описание функций меню панели "Target Videos and Input Faces".
Target Videos/Images (Select Videos/Images Path) — позволяет выбрать папку с целевыми видео или изображениями (лица для замены). Нажимая на кнопку с иконкой папки, вы открываете проводник, чтобы указать путь. Это упрощает загрузку нескольких файлов для замены лиц в проекте.
Search Videos/Images — запускает поиск лиц в загруженных целевых видео или изображениях. Нажимая на кнопку с галочкой и иконками файлов, программа анализирует содержимое выбранной папки, чтобы найти подходящие лица для обработки.
Drop Files or Click here to Select a Folder — предоставляет два способа загрузки целевых файлов: перетаскивание (drag-and-drop) видео или изображений в область или нажатие на текст для выбора папки через проводник. Это удобно для быстрого добавления медиафайлов.
Input Faces (Select Face Images Path) — позволяет выбрать папку с исходными изображениями лиц, которые будут обработаны (в них заменят лица). Нажимая на кнопку с иконкой папки, вы указываете путь для загрузки файлов.
Search Faces — запускает поиск лиц в загруженных исходных изображениях. Нажимая на кнопку с галочкой и иконками файлов, программа анализирует содержимое выбранной папки, чтобы найти лица для замены.
Drop Files or Click here to Select a Folder — предлагает два способа загрузки исходных файлов: перетаскивание (drag-and-drop) изображений в область или нажатие на текст для выбора папки через проводник. Это упрощает добавление изображений для обработки.
Краткое описание функций центрального окна панели интерфейса.
Media Panel — выбирайте эту опцию (слева в верхней части интерфейса) для работы с видео или изображениями, которые вы хотите обработать. Здесь можно загрузить файлы через "Target Videos/Images" или "Input Faces", чтобы программа могла приступить к анализу и обработке контента.
Faces Panel — активируйте эту панель (рядом с "Media Panel") для управления обнаруженными лицами в загруженных файлах. Здесь вы можете просматривать, выбирать и настраивать лица, которые будут использоваться для замены или анализа.
Parameters Panel — используйте эту опцию (рядом с "Faces Panel") для настройки параметров обработки, таких как качество, стиль или другие настройки алгоритма. Это позволяет точно контролировать результат работы программы в соответствии с вашими предпочтениями.
View Face Compare — включите эту функцию (справа в верхней части интерфейса) для сравнения обнаруженных лиц с эталонными или загруженными лицами. Это полезно для проверки точности распознавания и соответствия перед заменой.
View Face Mask — активируйте эту опцию (рядом с "View Face Compare") для просмотра масок лиц, наложенных на изображения или видео. Это помогает визуально оценить области, которые будут обработаны или заменены, и внести необходимые корректировки.
|< (Rewind) — нажимайте эту кнопку (слева от полосы воспроизведения), чтобы перемотать видео в начало. Это полезно, если нужно начать просмотр или обработку с первого кадра, например, перед новой заменой лиц.
> (Play/Pause) — используйте эту кнопку (в центре полосы воспроизведения) для воспроизведения или паузы видео. Нажмите, чтобы посмотреть обработанный результат, и снова, чтобы остановить, чтобы внести изменения в настройки.
>| (Forward) — нажмите эту кнопку (справа от полосы воспроизведения), чтобы перемотать видео вперёд. Это помогает быстро перейти к нужному участку видео для проверки или редактирования.
+ / - (Zoom) — нажмите "+" для увеличения масштаба видео (вверху ползунка), чтобы рассмотреть детали, или "-" для уменьшения (внизу ползунка), чтобы увидеть общий вид. Используйте по мере необходимости для точной работы с кадрами.
Save Image — нажимайте эту кнопку (в левом нижнем углу панели) для сохранения текущего кадра или обработанного изображения в выбранную папку (настроенную в "Output Directory"). Это удобно для экспорта результатов работы.
Search Embeddings — кликайте по этой строке (с иконкой папки) для загрузки заранее созданных данных эмбеддингов (данных лиц) через проводник. Это ускоряет обработку, если вы уже сохранили эмбеддинги ранее, и используется после загрузки медиафайлов.
Find Faces — нажмите эту кнопку (ниже "Save Image") для поиска лиц в загруженных видео или изображениях. Обычно это первый шаг после загрузки файлов через "Target Videos/Images" или "Input Faces", чтобы программа определила лица для замены.
Clear Faces — используйте эту кнопку (ниже "Find Faces"), чтобы очистить список найденных лиц. Нажмите, если нужно начать поиск заново или удалить ошибочно детектированные лица, перед повторным использованием "Find Faces".
Swap Faces — нажмите эту кнопку (ниже "Clear Faces") для выполнения замены лиц в выбранных видеоклипах или изображениях. Это главный шаг после того, как вы нашли лица и настроили параметры в "Control Options".
Edit Faces — кликните по этой кнопке (внизу панели) для входа в режим редактирования лиц. Это позволяет вручную корректировать параметры, такие как маски или ключевые точки, после "Swap Faces", если результат требует доработки.
Краткое описание функций меню "Control Options" - "Face Swap".
Swapper Model — позволяет выбрать модель для замены лиц, например, "inswapper128". Выбирается из выпадающего списка, чтобы настроить точность и скорость обработки. Подходит для подбора оптимальной модели в зависимости от задачи, будь то скорость или качество результата.
Swapper Resolution — устанавливает разрешение замены лиц, например, 128. Регулируется через выпадающий список: большее значение повышает качество, но замедляет работу. Используется для баланса между качеством и производительностью.
Face Landmarks Correction — включает или выключает корректировку ключевых точек лица через переключатель. Активирует настройки для точного позиционирования лица.
Face Adjustments — включает или выключает общую корректировку параметров лица через переключатель. Если активировано, открывает доступ к тонкой настройке точек и масштаба лица, улучшая точность замены при ошибках позиционирования.
Keypoints X-Axis — регулирует горизонтальное положение ключевых точек лица ползунком (по умолчанию 0). Сдвиг вправо или влево корректирует позицию лица по оси X, чтобы устранить боковое смещение.
Keypoints Y-Axis — настраивает вертикальное положение ключевых точек лица ползунком (по умолчанию 0). Сдвиг вверх или вниз исправляет вертикальное смещение лица для точного выравнивания.
Keypoints Scale — изменяет масштаб ключевых точек лица ползунком (по умолчанию 0). Увеличение или уменьшение масштабирует лицо, чтобы устранить ошибки размера в кадре.
Face Scale Amount — регулирует общий масштаб заменённого лица ползунком (по умолчанию 0). Позволяет увеличить или уменьшить размер лица для естественного вида в видео или фото.
5 - Keypoints Adjustments — включает или выключает настройку пяти ключевых точек лица через переключатель. Активирует параметры для точного позиционирования глаз, носа и рта.
Left Eye: X — корректирует горизонтальное положение левого глаза ползунком (по умолчанию 0). Сдвиг помогает точно позиционировать глаз по оси X для натурального результата.
Left Eye: Y — настраивает вертикальное положение левого глаза ползунком (по умолчанию 0). Сдвиг вверх или вниз улучшает выравнивание глаза в заменённом лице.
Right Eye: X — регулирует горизонтальное положение правого глаза ползунком (по умолчанию 0). Сдвиг корректирует позицию глаза по оси X для точности.
Right Eye: Y — настраивает вертикальное положение правого глаза ползунком (по умолчанию 0). Сдвиг вверх или вниз обеспечивает корректное расположение глаза.
Nose: X — корректирует горизонтальное положение носа ползунком (по умолчанию 0). Сдвиг по оси X выравнивает нос для реалистичной замены лица.
Nose: Y — регулирует вертикальное положение носа ползунком (по умолчанию 0). Сдвиг вверх или вниз обеспечивает точное размещение носа в кадре.
Left Mouth: X — настраивает горизонтальное положение левой части рта ползунком (по умолчанию 0). Сдвиг корректирует позицию для естественного вида.
Left Mouth: Y — регулирует вертикальное положение левой части рта ползунком (по умолчанию 0). Сдвиг вверх или вниз улучшает выравнивание рта.
Right Mouth: X — корректирует горизонтальное положение правой части рта ползунком (по умолчанию 0). Сдвиг по оси X обеспечивает точность позиционирования.
Right Mouth: Y — настраивает вертикальное положение правой части рта ползунком (по умолчанию 0). Сдвиг вверх или вниз помогает правильно расположить рот.
Face Similarity Threshold — устанавливает порог схожести лиц для замены ползунком (по умолчанию 60, диапазон 0–100). Более высокое значение требует большей схожести, снижая ошибки при различиях между лицами.
Strength (Amount) — регулирует интенсивность эффекта замены лица ползунком (по умолчанию 100). Уменьшение делает замену менее заметной, а увеличение — более выраженной.
Face Likeness (Amount) — настраивает степень похожести заменённого лица на исходное ползунком (по умолчанию 0.00). Увеличение усиливает сходство для более естественного результата.
Differencing (Amount) — корректирует различия между исходным и заменённым лицом ползунком (по умолчанию 5). Увеличение или уменьшение позволяет тонко настроить визуальные различия.
Blend Amount — регулирует степень смешивания заменённого лица с исходным ползунком (по умолчанию 0). Увеличение делает переход между лицами более плавным и естественным.
Bottom Border — регулирует нижнюю границу маски лица ползунком (по умолчанию 10). Увеличение или уменьшение определяет область маски снизу, чтобы улучшить точность замены.
Left Border — настраивает левую границу маски лица ползунком (по умолчанию 10). Сдвиг корректирует область маски слева для плавного перехода.
Right Border — регулирует правую границу маски лица ползунком (по умолчанию 10). Увеличение или уменьшение определяет область справа для точной обработки.
Top Border — настраивает верхнюю границу маски лица ползунком (по умолчанию 10). Сдвиг корректирует область маски сверху для естественного вида.
Top Border Blur — регулирует размытие верхней границы маски ползунком (по умолчанию 35). Увеличение делает переход smoother, уменьшая заметность маски.
Occlusion Mask — включает или выключает маску для скрытых участков лица через переключатель. Используется для обработки заслонённых частей лица.
Size (Occlusion Mask) — настраивает размер маски для скрытых участков ползунком (по умолчанию 0). Увеличение увеличивает область обработки.
DFL XSeg Mask — включает или выключает маску DFL XSeg для точной обработки лица через переключатель. Используется для улучшения качества замены на сложных участках.
Size (DFL XSeg Mask) — регулирует размер маски DFL XSeg ползунком (по умолчанию 0). Увеличение расширяет область обработки для точности.
Occluder/DFL XSeg Blur — настраивает размытие маски для скрытых участков или DFL XSeg ползунком (по умолчанию 0). Увеличение смягчает границы маски.
Text Masking — включает или выключает маску для текстовых элементов через переключатель. Используется для обработки текста на лице или в кадре.
Text Masking Entry (Amount) — регулирует интенсивность маски для текстовых элементов ползунком (по умолчанию 50). Увеличение усиливает обработку текста.
Face Parser Mask — включает или выключает маску для анализа лица через переключатель. Используется для детального разбора и обработки лица.
Background — регулирует прозрачность или обработку фона ползунком (по умолчанию 0). Увеличение влияет на фон вокруг лица для улучшения результата.
Face — настраивает обработку самого лица ползунком (по умолчанию 0). Увеличение усиливает корректировку лица в маске.
Left Eyebrow — регулирует обработку левой брови ползунком (по умолчанию 0). Сдвиг корректирует видимость или положение брови.
Right Eyebrow — настраивает обработку правой брови ползунком (по умолчанию 0). Увеличение или уменьшение улучшает видимость брови.
Left Eye — регулирует обработку левого глаза ползунком (по умолчанию 0). Сдвиг корректирует глаз для естественного вида.
Right Eye — настраивает обработку правого глаза ползунком (по умолчанию 0). Увеличение улучшает видимость или положение глаза.
Eyeglasses — регулирует обработку очков ползунком (по умолчанию 0). Используется для коррекции очков на лице.
Nose — настраивает обработку носа ползунком (по умолчанию 0). Сдвиг корректирует нос для точной замены.
Mouth — регулирует обработку рта ползунком (по умолчанию 0). Увеличение улучшает видимость или положение рта.
Upper Lip — настраивает обработку верхней губы ползунком (по умолчанию 0). Сдвиг корректирует верхнюю часть рта.
Lower Lip — регулирует обработку нижней губы ползунком (по умолчанию 0). Увеличение улучшает видимость или положение нижней губы.
Neck — настраивает обработку шеи ползунком (по умолчанию 0). Сдвиг корректирует шею для естественного перехода с лицом.
Hair — регулирует обработку волос ползунком (по умолчанию 0). Увеличение улучшает видимость или коррекцию волос.
Background Blur — настраивает размытие фона ползунком (по умолчанию 5). Увеличение делает фон более мягким вокруг лица.
Face Blur — регулирует размытие лица ползунком (по умолчанию 5). Увеличение смягчает края лица для естественного вида.
Auto Color Transfer — включает или выключает автоматическую передачу цвета между лицами через переключатель. Используется для согласованности оттенков кожи и других элементов для естественного результата.
Transfer Type — позволяет выбрать тип передачи цвета, например, "Test". Настраивается через выпадающий список для настройки алгоритма цветокоррекции.
Blend Amount — регулирует степень смешивания при передаче цвета ползунком (по умолчанию 80). Увеличение усиливает эффект передачи цвета.
Color Adjustments — включает или выключает ручную настройку цвета лица через переключатель. Активирует параметры ниже для тонкой корректировки.
Red — настраивает красный оттенок лица ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Green — регулирует зелёный оттенок лица ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Blue — настраивает синий оттенок лица ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Brightness — регулирует яркость лица ползунком (по умолчанию 1.00). Увеличение делает лицо светлее, уменьшение — темнее.
Contrast — настраивает контраст лица ползунком (по умолчанию 1.00). Увеличение усиливает различия между светлыми и тёмными участками.
Saturation — регулирует насыщенность цвета лица ползунком (по умолчанию 1.00). Увеличение делает цвета ярче, уменьшение — бледнее.
Sharpness — настраивает резкость лица ползунком (по умолчанию 0.05). Увеличение делает края более чёткими, уменьшение — мягче.
Gamma — регулирует гамму лица ползунком (по умолчанию 1.00). Увеличение или уменьшение изменяет общий световой баланс.
Noise — настраивает уровень шума на лице ползунком (по умолчанию 0.00). Увеличение добавляет текстуру, уменьшение убирает шум.
JPEG Compression — включает или выключает сжатие JPEG через переключатель. Используется для оптимизации качества и размера выходного файла.
Compression — регулирует степень сжатия JPEG ползунком (по умолчанию 50). Выше — лучше качество, ниже — меньший размер файла.
Final Blend — включает или выключает финальное смешивание через переключатель. Активирует параметры ниже для итоговой обработки.
Final Blend Amount — настраивает интенсивность финального смешивания ползунком (по умолчанию 1). Увеличение усиливает эффект, уменьшение — снижает.
Overall Mask Blend Amount — регулирует степень смешивания общей маски ползунком (по умолчанию 0). Увеличение улучшает плавность переходов в маске.
Face Blur — регулирует размытие всего лица ползунком (по умолчанию 0). Увеличение смягчает края лица для естественного перехода.
Hair Makeup (Red) — настраивает красный оттенок макияжа волос ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Hair Makeup (Green) — регулирует зелёный оттенок макияжа волос ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Hair Makeup (Blue) — настраивает синий оттенок макияжа волос ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Hair) — регулирует степень смешивания макияжа волос с исходным цветом ползунком (по умолчанию 0.2). Увеличение делает цвет более насыщенным.
Lips Makeup (Red) — настраивает красный оттенок макияжа губ ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Lips Makeup (Green) — регулирует зелёный оттенок макияжа губ ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Lips Makeup (Blue) — настраивает синий оттенок макияжа губ ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Lips) — регулирует степень смешивания макияжа губ с исходным цветом ползунком (по умолчанию 0.2). Увеличение делает цвет более заметным.
Restore Eyes — включает или выключает восстановление глаз через переключатель. Активирует настройки ниже для улучшения глаз в заменённом лице.
Eyes Blend Amount — настраивает интенсивность восстановления глаз ползунком (по умолчанию 50). Увеличение усиливает эффект восстановления.
Eyes Size Factor — регулирует размер глаз ползунком (по умолчанию 3.0). Увеличение или уменьшение изменяет размер глаз для естественного вида.
Eyes Feather Blend — настраивает размытие краёв глаз ползунком (по умолчанию 10). Увеличение смягчает переходы для плавности.
X Eyes Radius Factor — регулирует горизонтальный радиус глаз ползунком (по умолчанию 1.0). Сдвиг корректирует ширину глаз.
Y Eyes Radius Factor — настраивает вертикальный радиус глаз ползунком (по умолчанию 1.0). Увеличение или уменьшение корректирует высоту глаз.
X Eyes Offset — регулирует горизонтальное смещение глаз ползунком (по умолчанию 0). Сдвиг корректирует позицию глаз по оси X.
Y Eyes Offset — настраивает вертикальное смещение глаз ползунком (по умолчанию 0). Сдвиг корректирует позицию глаз по оси Y.
Eyes Spacing Offset — регулирует расстояние между глазами ползунком (по умолчанию 0). Увеличение или уменьшение корректирует интервал между глазами.
Restore Mouth — включает или выключает восстановление рта через переключатель. Активирует настройки ниже для улучшения рта в заменённом лице.
Mouth Blend Amount — настраивает интенсивность восстановления рта ползунком (по умолчанию 50). Увеличение усиливает эффект восстановления.
Mouth Size Factor — регулирует размер рта ползунком (по умолчанию 25). Увеличение или уменьшение изменяет размер рта для естественности.
Mouth Feather Blend — настраивает размытие краёв рта ползунком (по умолчанию 10). Увеличение смягчает переходы для плавности.
X Mouth Radius Factor — регулирует горизонтальный радиус рта ползунком (по умолчанию 1.0). Сдвиг корректирует ширину рта.
Y Mouth Radius Factor — настраивает вертикальный радиус рта ползунком (по умолчанию 1.0). Увеличение или уменьшение корректирует высоту рта.
X Mouth Offset — регулирует горизонтальное смещение рта ползунком (по умолчанию 0). Сдвиг корректирует позицию рта по оси X.
Y Mouth Offset — настраивает вертикальное смещение рта ползунком (по умолчанию 0). Сдвиг корректирует позицию рта по оси Y.
Eyes/Mouth Blur — регулирует размытие глаз и рта ползунком (по умолчанию 0). Увеличение смягчает края для естественного вида.
Краткое описание функций меню "Control Options — Face Editor".
Crop Scale — регулирует масштаб обрезки лица ползунком (по умолчанию 2.50). Увеличение или уменьшение изменяет область обрезки для лучшего фокуса на лице.
Y/V Ratio — настраивает соотношение высоты и ширины обрезки лица ползунком (по умолчанию -0.125). Сдвиг корректирует пропорции для точного кадрирования.
Blur Amount — регулирует размытие обрезанной области лица ползунком (по умолчанию 5). Увеличение смягчает края для естественного перехода.
Enable Face Pose/Expression Editor — включает или выключает редактор поз и выражений лица через переключатель. Активирует настройки ниже для настройки движения и эмоций.
Face Editor Type — позволяет выбрать тип редактора лица, например, "Human-Face". Настраивается через выпадающий список для настройки стиля обработки.
Eyes Close <-> Open Ratio — регулирует степень закрытия/открытия глаз ползунком (по умолчанию 0.00). Увеличение открывает глаза, уменьшение — закрывает.
Lips Close <-> Open Ratio — настраивает степень закрытия/открытия губ ползунком (по умолчанию 0.00). Увеличение открывает губы, уменьшение — закрывает.
Head Pitch — регулирует наклон головы по вертикальной оси (pitch) ползунком (по умолчанию 0). Сдвиг наклоняет голову вверх или вниз.
Head Yaw — настраивает поворот головы по горизонтальной оси (yaw) ползунком (по умолчанию 0). Сдвиг поворачивает голову влево или вправо.
Head Roll — регулирует наклон головы вбок (roll) ползунком (по умолчанию 0). Сдвиг наклоняет голову влево или вправо по горизонтали.
X-Axis Movement — регулирует движение лица по горизонтальной оси (X) ползунком (по умолчанию 0.00). Сдвиг смещает лицо вправо или влево.
Y-Axis Movement — настраивает движение лица по вертикальной оси (Y) ползунком (по умолчанию 0.00). Сдвиг смещает лицо вверх или вниз.
Z-Axis Movement — регулирует движение лица по глубинной оси (Z) ползунком (по умолчанию 1.00). Увеличение или уменьшение изменяет глубину или перспективу лица.
Mouth Pouting — настраивает эффект надувания губ (pouting) ползунком (по умолчанию 0.00). Увеличение усиливает надувание для выражения эмоций.
Mouth Pursing — регулирует эффект сжатия губ (pursing) ползунком (по умолчанию 0.00). Увеличение усиливает сжатие для выражения эмоций.
Mouth Grin — настраивает эффект улыбки (grin) ползунком (по умолчанию 0.00). Увеличение усиливает улыбку для выражения радости.
Lips Close <-> Open Value — регулирует степень закрытия/открытия губ ползунком (по умолчанию 0). Увеличение открывает губы, уменьшение — закрывает.
Mouth Smile — настраивает интенсивность улыбки ползунком (по умолчанию 0.00). Увеличение усиливает улыбку для более выразительного лица.
Eye Wink — регулирует моргание глаз ползунком (по умолчанию 0.00). Увеличение усиливает эффект моргания для анимации.
Eyebrows Direction — настраивает направление бровей ползунком (по умолчанию 0.00). Сдвиг корректирует положение бровей для выражения эмоций.
EyeGaze Horizontal — регулирует горизонтальное направление взгляда глаз ползунком (по умолчанию 0.00). Сдвиг смещает взгляд влево или вправо.
EyeGaze Vertical — настраивает вертикальное направление взгляда глаз ползунком (по умолчанию 0.00). Сдвиг смещает взгляд вверх или вниз.
Face Makeup — включает или выключает макияж лица через переключатель. Активирует настройки ниже для цветокоррекции лица.
Red (Green color adjustments) — настраивает красный оттенок макияжа лица ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Green (Green color adjustments) — регулирует зелёный оттенок макияжа лица ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Blue (Green color adjustments) — настраивает синий оттенок макияжа лица ползунком (по умолчанию 0.05). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Face Makeup) — регулирует степень смешивания макияжа лица с исходным цветом ползунком (по умолчанию 0.05). Увеличение делает цвет более насыщенным.
Hair Makeup — включает или выключает макияж волос через переключатель. Активирует настройки ниже для цветокоррекции волос.
Red (Hair Makeup) — настраивает красный оттенок макияжа волос ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Green (Hair Makeup) — регулирует зелёный оттенок макияжа волос ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Blue (Hair Makeup) — настраивает синий оттенок макияжа волос ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Hair Makeup) — регулирует степень смешивания макияжа волос с исходным цветом ползунком (по умолчанию 0.05). Увеличение делает цвет более насыщенным.
Eyebrows Makeup — включает или выключает макияж бровей через переключатель. Активирует настройки ниже для цветокоррекции бровей.
Red (Eyebrows Makeup) — настраивает красный оттенок макияжа бровей ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Green (Eyebrows Makeup) — регулирует зелёный оттенок макияжа бровей ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Blue (Eyebrows Makeup) — настраивает синий оттенок макияжа бровей ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Eyebrows Makeup) — регулирует степень смешивания макияжа бровей с исходным цветом ползунком (по умолчанию 0.05). Увеличение делает цвет более насыщенным.
Lips Makeup — включает или выключает макияж губ через переключатель. Активирует настройки ниже для цветокоррекции губ.
Red (Lips Makeup) — настраивает красный оттенок макияжа губ ползунком (по умолчанию 0). Сдвиг добавляет или уменьшает красный цвет для коррекции.
Green (Lips Makeup) — регулирует зелёный оттенок макияжа губ ползунком (по умолчанию 0). Увеличение или уменьшение корректирует зелёный цвет.
Blue (Lips Makeup) — настраивает синий оттенок макияжа губ ползунком (по умолчанию 0). Сдвиг добавляет или убирает синий цвет для настройки.
Blend Amount (Lips Makeup) — регулирует степень смешивания макияжа губ с исходным цветом ползунком (по умолчанию 0.05). Увеличение делает цвет более заметным.
Краткое описание функций меню "Control Options — Face Restorer"
Enable Face Restorer — включает или выключает первый восстановитель лица через переключатель. Активирует настройки ниже для улучшения качества заменённого лица.
Restorer Type — позволяет выбрать тип восстановителя лица, например, "GFPGAN-v1.4". Настраивается через выпадающий список для настройки алгоритма восстановления.
Alignment — устанавливает способ выравнивания лица, например, "Original". Выбирается из выпадающего списка для точного позиционирования.
Fidelity Weight — регулирует вес точности восстановления лица ползунком (по умолчанию 0.9). Увеличение усиливает точность, уменьшение — скорость.
Blend — настраивает степень смешивания восстановленного лица с исходным ползунком (по умолчанию 100). Увеличение делает результат более естественным.
Enable Face Restorer 2 — включает или выключает второй восстановитель лица через переключатель. Активирует настройки ниже для дополнительной обработки.
Restorer Type (Face Restorer 2) — позволяет выбрать тип второго восстановителя лица, например, "GFPGAN-v1.4". Настраивается через выпадающий список для настройки алгоритма.
Alignment (Face Restorer 2) — устанавливает способ выравнивания для второго восстановителя, например, "Original". Выбирается из выпадающего списка для точного позиционирования.
Fidelity Weight (Face Restorer 2) — регулирует вес точности восстановления для второго восстановителя ползунком (по умолчанию 0.9). Увеличение усиливает точность, уменьшение — скорость.
Blend (Face Restorer 2) — настраивает степень смешивания восстановленного лица (второй восстановитель) с исходным ползунком (по умолчанию 100). Увеличение улучшает естественность результата.
Enable Face Expression Restorer — включает или выключает восстановитель выражений лица через переключатель. Активирует настройки ниже для сохранения эмоций.
Crop Scale — регулирует масштаб обрезки лица для восстановления ползунком (по умолчанию 2.30). Увеличение или уменьшение изменяет область обрезки для лучшего фокуса.
Y/V Ratio — настраивает соотношение высоты и ширины обрезки лица для восстановления ползунком (по умолчанию -0.125). Сдвиг корректирует пропорции для точного кадрирования.
Expression Friendly Factor — регулирует фактор дружелюбности выражений лица ползунком (по умолчанию 1.0). Увеличение или уменьшение усиливает или смягчает эмоции.
Animation Region — позволяет выбрать область анимации, например, "all". Настраивается через выпадающий список для настройки движения лица.
Normalize Lips Threshold — устанавливает порог нормализации губ ползунком (по умолчанию 0.03). Увеличение или уменьшение корректирует форму и положение губ.
Normalize Eyes Threshold — настраивает порог нормализации глаз ползунком (по умолчанию 0.03). Увеличение или уменьшение корректирует форму и положение глаз.
Retargeting Eyes Multiplier — регулирует множитель переноса движений глаз ползунком (по умолчанию 1.00). Увеличение усиливает движения, уменьшение — снижает.
Retargeting Lips Multiplier — настраивает множитель переноса движений губ ползунком (по умолчанию 1.00). Увеличение усиливает движения, уменьшение — снижает.
Краткое описание функций меню "Control Options — Common Settings".
Output Directory — позволяет выбрать папку для сохранения обработанных файлов. Нажимая "Browse Folder", вы указываете путь, куда будут сохраняться результаты работы программы, такие как видео или изображения с заменёнными лицами. Это удобно для организации проектов и доступа к готовым файлам.
Appearance (Theme) — настраивает тему интерфейса, например, "Dark" (тёмная). Выбирается из выпадающего списка для изменения внешнего вида программы. Это улучшает удобство работы, особенно в условиях разного освещения.
General Priority (Providers Priority) — устанавливает приоритет вычислительных ресурсов, например, "CUDA". Выбирается из выпадающего списка для оптимизации производительности, используя GPU для ускорения обработки. Это важно для работы с большими файлами или сложными задачами.
Number of Threads — регулирует количество потоков для параллельной обработки ползунком (по умолчанию 2). Увеличение ускоряет работу, но может увеличить нагрузку на систему. Используется для настройки производительности на многоядерных процессорах.
Video Settings (Set Custom Video Playback FPS) — позволяет установить пользовательский FPS (кадры в секунду) для воспроизведения видео ползунком (по умолчанию 30). Увеличение или уменьшение корректирует скорость и плавность воспроизведения в интерфейсе, что полезно для тестирования.
Video Playback FPS — регулирует стандартный FPS воспроизведения видео ползунком (по умолчанию 30). Увеличение или уменьшение изменяет скорость воспроизведения, обеспечивая комфортный просмотр обработанных файлов.
Auto Swap — включает или выключает автоматическую замену лиц через переключатель. Если активировано, программа автоматически выполняет замену без дополнительных действий, ускоряя работу с большими наборами данных.
Detectors (Face Detect Model) — позволяет выбрать модель для детекции лиц, например, "RetinaFace". Настраивается через выпадающий список для настройки точности и скорости распознавания лиц в видео или изображениях.
Detect Score Faces — устанавливает минимальный порог уверенности для детекции лиц ползунком (по умолчанию 50, диапазон 0–100). Более высокое значение повышает точность, но может пропускать слабые совпадения.
Max No. of Faces to Detect — ограничивает максимальное количество лиц, которые программа будет детектировать в кадре ползунком (по умолчанию 20). Уменьшение ускоряет обработку, но ограничивает количество обнаруживаемых лиц.
Auto Rotation — включает или выключает автоматическое вращение лиц для корректного выравнивания через переключатель. Используется для улучшения детекции при неправильном положении лица.
Manual Rotation — регулирует ручное вращение лиц ползунком (по умолчанию 0). Сдвиг корректирует угол наклона лица для точной обработки, если автоматическая ротация не сработала.
Enable Landmark Detection — включает или выключает детекцию ключевых точек лица (landmarks) через переключатель. Активирует настройки ниже для анализа положения глаз, носа и рта.
Landmark Detect Model — позволяет выбрать модель для детекции ключевых точек, например, "203". Настраивается через выпадающий список для настройки точности и скорости.
Landmark Detect Score — устанавливает минимальный порог уверенности для детекции ключевых точек ползунком (по умолчанию 50, диапазон 0–100). Более высокое значение повышает точность, но может снизить скорость.
Detect from Points — включает или выключает детекцию лиц по заданным точкам через переключатель. Используется для точной обработки определённых областей.
Show Landmarks — включает или выключает отображение ключевых точек лица в интерфейсе через переключатель. Полезно для визуальной проверки расположения точек.
Show Bounding Boxes — включает или выключает отображение рамок вокруг лиц в интерфейсе через переключатель. Удобно для проверки детекции лиц.
DFM Settings (Maximum DFM Models to use) — ограничивает максимальное количество моделей DeepFaceManip (DFM) для использования ползунком (по умолчанию 1). Уменьшение ускоряет обработку, увеличивая — улучшает качество, но может замедлить работу.
Enable Frame Enhancer — включает или выключает улучшитель кадров через переключатель. Используется для повышения качества видео или изображений, улучшая детали и текстуры.
Frame Enhancer Type — позволяет выбрать тип улучшителя кадров, например, "RealESRGAN-x2-Plus". Настраивается через выпадающий список для настройки алгоритма обработки.
Blend — регулирует степень смешивания улучшенных кадров с исходными ползунком (по умолчанию 100). Увеличение усиливает эффект, уменьшение — сохраняет больше исходного качества.
Webcam Max No — устанавливает максимальное количество веб-камер для использования, например, "1". Выбирается из выпадающего списка для настройки работы с веб-камерой.
Webcam Backend — выбирает движок для работы с веб-камерой, например, "Default". Настраивается через выпадающий список для оптимизации производительности.
Webcam Resolution — задаёт разрешение веб-камеры, например, "1280x720". Выбирается из выпадающего списка для настройки качества видео с камеры.
Webcam FPS — устанавливает частоту кадров веб-камеры, например, "30". Выбирается из выпадающего списка для настройки плавности трансляции.
Send Frames to Virtual Camera — включает или выключает отправку обработанных кадров на виртуальную камеру через переключатель. Используется для стримов или записи через программы вроде OBS.
Virtual Camera Backend — выбирает движок виртуальной камеры, например, "obs". Настраивается через выпадающий список для интеграции с конкретным ПО.
Face Recognition (Recognition Model) — позволяет выбрать модель распознавания лиц, например, "inswapper128ArcFace". Настраивается через выпадающий список для точного определения лиц.
Swapping Similarity Type — устанавливает тип схожести для замены лиц, например, "Opal". Выбирается из выпадающего списка для настройки точности замены.
Embedding Merge Method — определяет метод объединения эмбеддингов (данных лиц), например, "Mean". Выбирается из выпадающего списка для настройки обработке нескольких лиц.
Target Media Include Subfolders — включает или выключает поиск целевых медиафайлов в подпапках через переключатель. Удобно для работы с большими структурами папок.
Input Faces Include Subfolders — включает или выключает поиск исходных лиц в подпапках через переключатель. Упрощает загрузку файлов из сложных директорий.
Надеюсь эта информация поможет вам лучше ориентироваться при работе в VisoMaster.
В заключение хотелось бы сказать, что VisoMaster — это пример того, как технологии ИИ становятся ближе к обычным пользователям. Ещё недавно замена лиц требовала довольно серьёзных ресурсов и определенных навыков, а теперь это можно сделать дома просто установив программу и немного в ней разобравшись. Проект взял лучшее от Rope, стал удобнее и быстрее, а сообщество продолжает его развивать: в последних версиях появились такие мелочи, как выбор нескольких лиц с Shift и улучшенные подсказки в интерфейсе. При этом он остаётся бесплатным и открытым для всех.
Если вы хотите попробовать что-то новое, создать интересный контент или разобраться в нейросетях, VisoMaster — отличный выбор. Установите его и поделитесь в комментариях своими впечатлениями.
Ну и конечно же, если вам понравилась эта статья, буду рад вашим подпискам, комментариям и лайкам. Недавно я запустил Discord-канал и постараюсь поддерживать его насколько возможно, там вы сможете не только следить за новостями, но и общаться, делиться опытом и приобретать новые знания о нейросетях. Чтобы всегда быть в курсе моих новых материалов, подписывайтесь на мой Boosty, Telegram-канал и страницу "ВКонтакте". Пока что нас немного, но я надеюсь, что с течением времени сообщество станет больше. Это станет отличной мотивацией для меня активно работать и над другими социальными сетями.