Найти в Дзене
Qv35t: ИИ без хайпа.

ИИ постоянно забывает лица ваших персонажей? Секрет в 3 фото и одном волшебном слове.

Всем привет, с вами Qv35t! 👋 После статьи про фотореализм мне задали вопрос, который бьет в самое больное место: «Отлично, я создал одного реалистичного человека. А как теперь создать второго, третьего, десятого — и чтобы это был ОН, а не случайный похожий двойник?» Представьте: вы часами шлифуете в ИИ портрет главного героя. Получилось идеально. Вы пытаетесь «посадить» его в машину или «посмотреть», как он улыбается — и нейросеть выдает совершенно другого человека. Нос не тот, разрез глаз иной, родинка исчезла. Это — дрифт (дрейф, «забывчивость» ИИ). Абсолютный бич для всех, кто создает истории, игры или серийный контент. Долгое время я думал, что это предел технологий. Оказалось — предел моего подхода. Я просил ИИ «сделать того же парня», но не давал ему цифрового отпечатка личности. Решение, которое собрало консенсус в анализе 6 разных ИИ-моделей, звучит так: consistency_id + фото с 3 ракурсов = стабильный персонаж. Вы перестаете быть художником, который каждый раз рисует лицо зано
Оглавление

Всем привет, с вами Qv35t! 👋

После статьи про фотореализм мне задали вопрос, который бьет в самое больное место: «Отлично, я создал одного реалистичного человека. А как теперь создать второго, третьего, десятого — и чтобы это был ОН, а не случайный похожий двойник?»

Представьте: вы часами шлифуете в ИИ портрет главного героя. Получилось идеально. Вы пытаетесь «посадить» его в машину или «посмотреть», как он улыбается — и нейросеть выдает совершенно другого человека. Нос не тот, разрез глаз иной, родинка исчезла.

Это — дрифт (дрейф, «забывчивость» ИИ). Абсолютный бич для всех, кто создает истории, игры или серийный контент.

Долгое время я думал, что это предел технологий. Оказалось — предел моего подхода. Я просил ИИ «сделать того же парня», но не давал ему цифрового отпечатка личности.

Решение, которое собрало консенсус в анализе 6 разных ИИ-моделей, звучит так: consistency_id + фото с 3 ракурсов = стабильный персонаж.

Вы перестаете быть художником, который каждый раз рисует лицо заново. Вы становитесь кастинг-директором, который вызывает уже утвержденного актера по имени.

🚫 Почему слова — это провал? (Старая проблема)

Раньше мой промт был слепой надеждой:

«Тот же молодой человек: короткие каштановые волосы, зеленые глаза, острый подбородок, в кожаной куртке.»

Почему не работает:

  • Субъективно: «Острый подбородок» — это как?
  • Неполно: Форма бровей? Ширина носа? Посадка ушей?
  • Шумно: Нейросеть цепляется за «кожаную куртку» сильнее, чем за лицо.

Итог: лотерея. Нужен однозначный способ дать информацию. И это — картинки + уникальный ключ.

📸 Шаг 1: Создаем «цифровой фоторобот» (3 фото)

Вам нужно не одно «идеальное» фото. Нужна система фото, покрывающая лицо с ключевых ракурсов.

Минимум для работы:

  1. Фронтал (ref_front.jpg): Прямой взгляд, нейтральное выражение.
  2. Три четверти (ref_3q.jpg): Поворот головы на ~45 градусов.
  3. Профиль (ref_side.jpg): Вид сбоку.

❗ Правила «съемки» (генерации) этого набора:

  • Единый стиль: Все фото — в одном, реалистичном стиле (как в прошлой статье).
  • Ровный свет: Без резких теней, искажающих форму.
  • Нейтральное выражение: Лучше начинать без улыбки.

Вы даете ИИ не картинки, а геометрию лица. Фактически, строите примитивную 3D-модель.

🔑 Шаг 2: «Волшебное слово» — consistency_id

consistency_id — это уникальный ID-паспорт вашего персонажа. Например: detective_max, cyber_girl_01, wizard_old.

Как работает? Когда вы в промте указываете "consistency_id": "detective_max", нейросеть ищет в своей памяти все изображения с этим тегом и использует их как основу для нового. Это якорь, который привязывает запрос к нужной внешности.

🧩 Шаг 3: Собираем все вместе (Готовый шаблон)

Чтобы не изобретать велосипед, я перешел к структурированным запросам. Это признак системного подхода.

Вот упрощенный, но готовый к использованию шаблон. Копируйте и меняйте значения:

json
{
"consistency_id": "ваш_персонаж_01", // Например, "detective_max"
"subject": "Тот самый персонаж из референсов",
"scene": "Полный рост, стоит под дождем ночью, отражение неона",
"style": { // Параметры из статьи про фотореализм
"color": "Rec.709, контраст теплый/холодный",
"пленка": "Kodak Portra 400",
"объектив": "Анаморфный, f/1.8"
}
}

Что это дает?

  • Четкость: Все по полочкам.
  • Повторяемость: Сохранили шаблон — меняете только сцену (scene).
  • Масштабируемость: Такую структуру можно автоматизировать.

🚀 Как это работает у меня на практике

  1. База: Генерирую 3-4 фото одного лица в Nano Banana (использую приемы фотореализма). Называю: max_front.jpg, max_3q.jpg.
  2. Паспорт: Присваиваю consistency_id: detective_max_v1.
  3. Загрузка: Загружаю фото в нейросеть, связываю с этим ID.
  4. Творчество: Чтобы получить детектива Макса в баре, пишу: "consistency_id": "detective_max_v1", сидит за барной стойкой, усталый взгляд, держит стакан. ИИ «подставляет» нужное лицо.

⚡ Важно: Метод эффективен на 85-90%. Иногда дрифт случается. Всегда закладывайте время на правку. Это нормально.

💎 Вывод: Почему это меняет правила игры?

Персонаж перестает быть везением. Он становится цифровым активом.

У него есть паспорт (consistency_id), фото на документы (референсы) и досье (шаблон). Этот актив можно использовать в десятках сцен, документировать и даже передавать в автоматизированные конвейеры.

Практика для вас:

  1. Создайте 3 фото одного лица (фронт, ¾, профиль).
  2. Дайте ему consistency_id: test_01.
  3. Сделайте два запроса с этим ID: «улыбается» и «серьезный». Узнаете ли вы своего героя?

А что дальше? В следующем выпуске поднимемся на уровень выше. Как хранить десятки таких персонажей и рецептов, чтобы не утонуть? Поговорим об организации вашей цифровой студии с помощью Perplexity Spaces.

Чтобы не пропустить статью о том, как систематизировать все свои ИИ-активы и методики — подписывайтесь на канал! Дальше будет еще больше практики и системного подхода.

Подписаться →

#нейросети #искусственныйинтеллект #AIарт #гениративноеискусство #созданиеконтента #digitalart #креативныетехнологии