Мир меняется, и в последние 5 лет очень быстро. То, что казалось фантастикой, становится обыденностью. Каждый из нас может создавать благодаря ИИ: тексты, картины, музыку, коды, видео. Причем нейросети делают это с каждый разом все лучше и детальней. Да это не уникальное творчество, и Рафаэлем или Моцартом с технологиями мы не станем. Но сможем делать свою работу лучше, интересней.
Правда, генерация видео для больших языковых моделей оказалась самой сложной задачей. Первые попытки были просто страшными и жуткими. Например, вот так выглядел Уилл Смит, поедающий спагетти.
Сейчас дела обстоят лучше, но все же не идеально. Так что надеяться пока на полную замену режиссеров, видеооператоров и видеодизайнеров не стоит. И чтобы получилось что-то действительно хорошее надо хорошо постараться с промтом и поработать с конечным результатом. Но небольшие ролики по 10-15 секунд им все же под силу.
Составили актуальный список полезных ИИ, которые умеют генерировать видео. Две нейронки еще не доступны, остальными пять вы уже можете воспользоваться. Правда, есть условно бесплатные (с лимитом генераций), есть полностью платные. К некоторым придется ждать доступа.
Самая нашумевшая нейронка для создания роликов от Open AI. Получается очень круто. Подход у нее инновационный, диффузионный. Между кадрами плавный переход. Прорисовка всех деталей поражает. Одновременно «работает» несколько планов. Даже самый простой промт благодаря Chat GPT она преобразует в развернутое детальное описание для дальнейшего преобразование в видео.
Длина ролика может достигать почти 2 минуты – это очень много. Но есть один большой минус. Нейросеть находится в стадии тестирования, доступ к ней дали ограниченному кругу дизайнеров, режиссеров и прочих творческих личностей. Дату релиза для обычных граждан пока не сообщают.
«Наша самая эффективная генеративная видеомодель» - заявляет компания. Представленные на сайте ролики действительно впечатляют. Переход кадров плавный, нет мерцания и исчезающих картинок. Но во-первых, с клиентами из России они не работают – надо указать другую страну. Во-вторых, доступ к ней пока дали не всем. Чтобы участвовать в тестировании, нужно записаться в очередь. Для этого у вас должна быть почта Google.
Нейросеть от китайской компании Kuaishou. Тоже какое-то время ей могли пользоваться только избранные. 24 июля доступ получили все. При регистрации дают 66 кредитов на день, один несложный ролик тянет на 10-15 кредитов. Длина до 15 секунд. Возможно, за деньги можно и больше. Но мы не оформляли подписку.
Получается весьма реалистично. Можно указать расположение камеры, ракурс и соотношение сторон, прописать стиль. Также есть негативный промт: в нем говорите то, чего не должно быть в кадре. Понимает русский.
Сразу же делает в высоком качестве. Но чтобы не ждать по полчаса своей очереди, рекомендуем сократить требования к картинке. Тогда все пойдет быстрее. Все видео скачивается, причем без водяных знаков.
Новая модель в линейке Runway. Изображение более точные и плавные, части изображения согласованы между собой. Но за нее просят 15$ в месяц. Есть бесплатная предыдущая версия Gen-2. Но сколько мы не бились с ней, не смогли получить достойного видеоряда. Возможно, у опытных промт-инженеров получаются отличные результаты. Нейросеть принимает промт только на английском, дает выбрать направление камеры, соотношение сторон, стиль. Для начала дают 400 кредитов.
Кстати, один из плюсов Gen – работает с вашим изображением и оживляет его. Сказочный мир Гарри Поттера все ближе. Создает и видео, и генерит картинки.
Нейросеть предлагает создать видео длительностью до 6 секунд. Совсем немного. Пользователю бесплатно дают 100 пунктов в день. При регистрации есть еще 100 бонусов.
Из минусов – не хватило плавности перехода между кадрами. В настройках можно выбрать соотношение сторон, движение камеры. Доступно загрузить изображение, чтобы указать похожий стиль.
Инструменты есть, но возможности, конечно, отличаются от той же Sora или Kling. Если просто поиграться – то вполне подойдет. К тому же, интерфейс очень простой. Но доработать видео после генерации не получится.
Еще одна нейросеть для творчества. Есть бесплатный базовый вариант. Каждому дают при регистрации 250 кредитов, когда они закончатся, то до 30 в день.
Отличается от остальных моделей готовым звуковым сопровождением видео (за него снимают кредиты). Но можно его отменить. Также есть возможность назначить стиль, параметры «съемки». Но ролики получаются очень короткими. За полноценный вариант придется раскошелиться.
Разработчики предлагают несколько вариантов платных подписок. Профессиональная стоит 58$.
Stable Video Diffusion
Создает видео по картинке и по текстовому запросу. Название, скорее всего, вам знакомо – это один из основных конкурентов Midjourney. Есть три варианта для творчества. Первый – это демо на Hugging Face. Но его возможности сильно ограничены. Генерирует только с готового изображения, можно рассчитывать только на 25 кадров за раз.
В веб-приложении все гораздо продуманней и удобней. Есть возможность текстовых запросов. Причем в отличие от остальных нейронок, Stable Video Diffusion сначала создает изображение, предлагает выбрать несколько вариантов, а потом из понравившегося уже делает видео. Правда, за картинку возьмут кредиты. Пользователь получает 150 на день.
Здесь очень много настроек и с ними лучше разобраться предварительно. Например, камера может двигаться вверх, вниз, облетать по кругу, имитировать наклон, тряску рук, смещаться в бок. Амплитуда движений также выбирается из предложенных вариантов.
Один минус – доступ дадут не сразу, а если отправите запрос и встанете в очередь. Можно прождать несколько месяцев.
Третий вариант – это готовый код, который разработчики опубликовали в общем доступе. Но воспользоваться им и установить на компьютер сможет не каждый.
СОВЕТЫ
Просите изобразить то, с чем нейронка справится. У нее плохо получаются драки, сцены на взаимодействие, скоростные движения. Также трудно дается крупный план.
Для большей реалистичности человека в кадре, лучше дать сети образец. Многие модели это позволяют. Так быстрее и удобней.
Вся загвоздка – в правильном промте. Опытные инженеры советуют использовать такую схему: стиль – камера - объект - действие - окружение - освещение. Например: гиперреализм, общий план, старая деревня - открываются двери - на заднем плане лес - утренний свет.
ВАЖНО
Чтобы все работало без сбоев, нужны ресурсы компьютера и стабильный интернет. Последнее обеспечить достаточно просто. У каждого оператора есть тарифные планы с высокой скоростью (МТС, билайн, Ростелеком, Дом.ру). Важно, чтобы ваше оборудование было готово. Ну и самое главное - было свободное время для творческих экспериментов. Помним, что совершенство приходит с опытом.
Ждем вас в нашем Telegram, где публикуем самые интересные новости из мира технологий. Скучно точно не будет.
#домконнект#домашнийинтернет#домашнеетелевидение#домашнеетв #провайдерыроссии#мтс#билайн#подключитьинтернет#mts#beeline#domkonnekt#rostelecom#провайдеры#нейросети#ИИ#видеонейронки#sora#kling#pika#gen#genmo#stablevideodiffusion