Пять нейросетей, одна команда - и видео уже на канале
Создание одного короткого ролика для YouTube - это сценарий, подбор картинок, озвучка, монтаж, субтитры, загрузка. Минимум пара часов, если делать руками. А если заказывать - от тысячи рублей за минуту.
YouTube Shorts Pipeline устроен иначе. Вы пишете одну строчку - тему ролика. Программа сама ищет информацию, сочиняет сценарий, рисует картинки, озвучивает, добавляет субтитры и загружает готовое видео на YouTube. Всё - за одну команду. По данным автора проекта, один ролик обходится примерно в 10 центов и занимает 3-5 минут.
Когда я увидел, что весь этот конвейер - работа одного разработчика и распространяется бесплатно с открытым кодом, - я дважды перепроверил. Не розыгрыш.
Как строчка текста становится роликом
Программа работает в три этапа. Каждый можно запускать по отдельности - удобно, если хочется, например, сначала прочитать сценарий и только потом запускать производство.
Первый этап - черновик. Вы задаёте тему. Программа ищет свежие факты через поисковик DuckDuckGo, собирает выжимку и передаёт нейросети Claude. Claude пишет сценарий на 60-90 секунд. Затем другая нейросеть - Gemini - придумывает описания для фоновых изображений, а заодно генерирует заголовок, теги и описание для YouTube.
Второй этап - производство. Gemini Imagen 3 рисует три вертикальных изображения, к каждому добавляется плавное движение камеры по картинке. Нейросеть ElevenLabs озвучивает сценарий реалистичным голосом. Whisper - ещё одна нейросеть - создаёт файл субтитров. Программа для монтажа ffmpeg собирает всё в готовый ролик.
Третий этап - загрузка. Видео автоматически отправляется на YouTube как приватное, вместе со всеми метаданными и субтитрами. Публиковать или оставить приватным - решаете вы.
Меня зацепила одна деталь. Разработчик встроил защиту от выдумок: Claude получает только те факты, которые нашёл поисковик, и обязан опираться только на них. Нейросеть не сочиняет отсебятину - и это редкость для подобных инструментов.
Десять центов за ролик - считаем вместе
Как указано в описании проекта, стоимость складывается так: написание сценария через Claude - около 2 центов, генерация трёх картинок через Gemini - примерно 3 цента, озвучка через ElevenLabs - порядка 5 центов. Итого: около 10 центов за готовое видео.
Но тут есть оговорка. Бесплатный тариф ElevenLabs не работает на серверах - для регулярного использования нужна подписка за $22 в месяц. Claude и Gemini, по данным разработчика, предлагают щедрые бесплатные лимиты при небольших объёмах. Если делать по паре роликов в день - можно уложиться почти бесплатно.
Коммерческие сервисы автоматического создания коротких видео берут от $15 до $50 в месяц и не дают никакого контроля. Здесь вы видите каждый шаг: можете отредактировать сценарий перед озвучкой, заменить картинки, выбрать другой голос, изменить описания для генерации изображений.
Python и командная строка - порог, который честнее не прятать
Теперь та часть, которая отсечёт многих. Программа написана на Python - это популярный язык программирования. Управляется через командную строку, а для первого запуска нужно получить ключи доступа к четырём сервисам: Anthropic, Google AI Studio, ElevenLabs и YouTube.
Разработчик добавил пошаговый мастер настройки - при первом запуске программа сама спрашивает ключи и сохраняет их. На странице проекта есть подробная инструкция. Но если словосочетание «командная строка» вызывает желание закрыть вкладку - этот инструмент пока не для вас. Тут я ничего приукрашивать не буду.
Для тех, кто с терминалом знаком: есть режим пробного прогона, который создаёт только сценарий без генерации видео. Удобно для проверки перед тем, как тратить деньги на нейросети. Сейчас программа поддерживает английский и хинди, но ElevenLabs умеет озвучивать на тридцати с лишним языках - добавить русский при желании можно.
Код проекта открыт под лицензией MIT - бесплатно для любых целей.
Конвейер из пяти нейросетей за 10 центов, собранный одним человеком и выложенный бесплатно, - за такие вещи я и ценю мир программ с открытым кодом. Коммерческие сервисы берут десятки долларов в месяц за ту же идею, только без доступа к внутренностям. Здесь вы видите, как всё устроено, и можете перекроить под свои задачи.
Как думаете: такие конвейеры через пару лет заменят ручной монтаж - или автоматические ролики так и останутся заметно «синтетическими»?
Источник: YouTube Shorts Pipeline
🔔 КликХак - канал для тех, кто предпочитает, чтобы нейросети работали на него, а не наоборот. Подпишитесь, пока они не научились подписываться сами.