Я начал делать юмористический мультфильм про Колобка, упёрся в проблему липсинка (открытие рта (артикуляция) синхронно с произносимыми словами) у животных, попробовал HeyGen – не зашло, полез искать альтернативы, наткнулся на Grok с генерацией видео, обрадовался… а потом выяснилось, что Маск не просто не хочет российских денег – он вообще не хочет меня. Даже с иностранной картой.
Когда делаешь мультфильм с говорящими животными, ты очень быстро перестаёшь верить в магию ИИ. Особенно когда тигр говорит, почти не открывая рот, а нейросеть Маска смотрит на тебя и думает: «Ты тут лишний».
Введение. С чего всё началось
Я вообще-то хотел простую вещь.
Ну, как простую. Сделать юмористический мультфильм по мотивам «Колобка», где звери устраивают суд, прокурор давит, адвокат юлит, а Колобок внезапно оказывается не жертвой, а малолетним рецидивистом. Абсурд. Сатира. Чистое удовольствие.
Сценарий есть. Персонажи есть. Судьи, тигр-прокурор, лиса, барсук. Всё красиво.
Осталось «всего лишь» оживить это в видео.
Вот тут и начинается самое интересное.
Проблема №1. Животные и липсинк – враги по жизни
Первым делом я полез в HeyGen. Из-за того, что в нем можно генерировать одним роликом до 2 минут. Особенно когда персонаж стабильный, как у меня Тигр-прокурор. Стоит - говорит. Чего же проще?
Инструмент хороший, бодрый, но есть нюанс, как говорится.
HeyGen плохо дружит с липсинком животных.
Не людей. С людьми всё нормально. Дед у меня живой, как настоящий.
А вот когда у тебя тигр – серьёзный, прокурорский, с пафосом – он говорит…
почти не открывая рта.
Стоит. Смотрит.
Речь идёт.
Рот – в режиме экономии.
Выглядит это так, будто тигр читает обвинение мысленно, а звук идёт из космоса.
Комично. Но не так, как я планировал.
📌 Вывод №1:
Есть ИИ, которые умеют липсинк.
Но какие из них корректно работают с животными – большой вопрос, и его нельзя решить теорией. Только тестами. Долгими. Болезненными.
Я притормозил и начал думать
В такие моменты я всегда делаю одно и то же.
Перестаю героически страдать и начинаю подбирать инструменты, а не верить в универсальную нейросеть «на всё».
Есть отдельные ИИ под липсинк.
Есть под видео.
Есть под персонажей.
Нужно собрать пайплайн, а не ждать чуда.
И вот тут мне попадается статья.
«А Grok, оказывается, умеет генерировать видео»
Я читаю. Моргаю. Перечитываю.
Grok. Тот самый. От Маска. Генерирует видео.
Думаю:
«А почему бы и нет. Дай-ка попробую».
Попробовал.
И… мне понравилось.
Движение норм.
Персонажи держатся.
Есть ощущение «живости».
Но, как всегда, есть нюанс.
Проблема №2. 480p – это боль
По умолчанию Grok выдаёт 480p.
И если ты делаешь мем – пойдёт.
Если тест – пойдёт.
Если мультфильм, который хочется показать людям… ну такое.
Качество мыльное.
Детали теряются.
А главное – к концу ролика персонаж начинает «плыть».
А теперь внимание, важный технический момент, который поймут только те, кто реально монтирует:
👉 Чтобы нормально склеивать сцены, я беру последний кадр предыдущего ролика и вставляю его в начало следующего.
Тогда склейка не дёргается, персонаж «помнит себя».
Так вот.
В 480p к концу ролика персонаж деградирует.
Если поставить рядом первый кадр сцены и последний – это уже два разных зверя.
Решение очевидное. Повышаем качество
Я думаю:
«Окей. Берём платную версию. Пусть будет 720p. Да, это не 4К, но уже не стыдно».
Максимум, на что Grok способен – 720p.
Но по сравнению с 480 – это уже жизнь.
И вот тут я решаю пополнить Grok.
И тут начинается не фарс.
Тут начинается философия.
Главная беда. Grok не хочет не деньги. Grok не хочет тебя
Важно:
это не история про российские карты. Это банально. Это даже обсуждать скучно. Беда глубже.
👉 Grok не пополняется даже с иностранных карт,
если твой аккаунт создан в санкционной стране.
VPN?
Смешно.
Grok не смотрит, где ты сейчас.
Он смотрит, кто ты по происхождению.
Google-аккаунт создан «не там»?
До свидания.
Деньги не списываются.
Подписка не включается.
Функции не открываются.
Ты вроде бы не прочь заплатить, ан нет.
Ты для него лишний.
Цитата, которую я бы повесил над рабочим столом
Маск не то чтобы не хочет денег от россиян.
Он их (российских денег), кажется, панически боится.
Лазеек нет.
VPN не работает.
Карты не аргумент.
Посредники не гарантия.
Коммерческая версия Grok завязана на точку рождения аккаунта.
И вот тут всё складывается в одну картину
Я сижу.
У меня:
– тигр, который в HeyGen говорит без рта
– Grok, который умеет видео, но только в 480p
– 720p, которое мне нужно
– и ИИ, который говорит: «Ты тут не по адресу»
И внезапно это перестаёт быть технической проблемой.
Это становится байкой старого моряка про цифровые границы.
Финал. Без морали, но с вопросом
Я не расстроился.
Честно.
Я просто ещё раз убедился:
ИИ – это не магия. Это инфраструктура. А инфраструктура всегда про границы.
Буду пробовать другие инструменты.
Буду тестировать липсинк для животных.
Буду собирать пайплайн дальше.
Колобок свой суд получит.
Тигр заговорит.
Рот откроется.
А теперь скажи честно.
Ты тоже упирался в ИИ, который вроде бы всё умеет, но именно тебе – нельзя?
Или я один такой моряк, который опять зашел не в тот порт, не там бросил якорь?