Трудности «оживления»: Почему ИИ путает национальности и как с этим бороться ?

25 февраля25 фев

2 мин

🤖 Создавая клип для мужа, я столкнулась с неожиданной проблемой. Мой муж — казах, но как только я просила нейросеть (Gemini, Qwen или Алису) «оживить» его или повернуть ему голову на фото — он вдруг начинал приобретать ярко выраженные китайские черты. Почему так происходит? Давайте заглянем «под капот» нейросетей. 1. На чем они учились? (Проблема датасетов) Нейросети обучаются на гигантских массивах данных из интернета. В этих базах данных сотни миллионов лиц. Однако исторически сложилось, что азиатский тип внешности в этих базах представлен в основном жителями Китая, Японии или Кореи. Для ИИ «азиатское лицо» — это часто некий «усредненный стандарт». Нейросеть просто не видит тонкой разницы между казахами, узбеками, якутами или монголами, пока мы ей об этом не скажем. 2. Как работает «оживление» Когда вы просите ИИ оживить фото, он не просто передвигает пиксели. Он дорисовывает те части лица, которые открываются при повороте. Как я решала эту проблему (мои лайфхаки – что я пробовала,

Почему так происходит? Давайте заглянем «под капот» нейросетей.

1. На чем они учились? (Проблема датасетов) Нейросети обучаются на гигантских массивах данных из интернета. В этих базах данных сотни миллионов лиц. Однако исторически сложилось, что азиатский тип внешности в этих базах представлен в основном жителями Китая, Японии или Кореи. Для ИИ «азиатское лицо» — это часто некий «усредненный стандарт». Нейросеть просто не видит тонкой разницы между казахами, узбеками, якутами или монголами, пока мы ей об этом не скажем.

2. Как работает «оживление» Когда вы просите ИИ оживить фото, он не просто передвигает пиксели. Он дорисовывает те части лица, которые открываются при повороте.

Если нейросеть «решает», что перед ней китаец (потому что в её базе данных таких лиц больше), она достраивает мимику и разрез глаз согласно этому шаблону.

Как я решала эту проблему (мои лайфхаки – что я пробовала, но мне было реально сложно):

✅ Уточняйте этнос в промпте. Не пишите просто «Asian man». Пишите конкретно: «Central Asian man, Kazakh ethnicity». Это заставляет ИИ искать в памяти нужные визуальные маркеры (форму скул, разрез глаз).

✅ Используйте Face Consistency (Постоянство лица). В продвинутых инструментах или специальных сервисах замены лиц, можно «приклеить» лицо поверх сгенерированного персонажа.

✅ Оживляйте через «Reference Image». Если вы используете инструменты вроде Gemini, GPT, Luma или Kling для анимации, загружайте фото как единственный источник. В описании (prompt) добавляйте: «Keep the facial features identical to the original photo, no changes in ethnicity» (Сохранить черты лица идентичными фото, без смены этноса).

Мой опыт с Алисой и Qwen: Эти модели — отличные текстовые помощники и художники, но они тоже заложники своих обучающих выборок. Заметили, как ИИ изображает чувства? Мне и всей моей семье Алиса упорно выдает такие эмоции, будто мы герои турецкого сериала! Это выглядит эффектно, но в жизни мы, люди с другим менталитетом, выражаем чувства иначе.

Если ИИ "гнет свою линию" и превращает ваше семейное видео в драму из Стамбула — меняйте промпт, добавляйте слова "спокойный", "сдержанный", "естественный". Нейросети учатся невероятно быстро, и я верю: скоро они поймут, что мир гораздо многограннее, чем шаблоны из интернета.

Итог: ИИ — это всего лишь зеркало мирового интернета. Он только учится понимать многообразие этого мира. И хотя иногда он ошибается, в наших силах стать для него мудрыми проводниками. Ведь именно мы помогаем технологиям увидеть и передать истинную красоту каждого народа — бережно и правдиво.