Добавить в корзинуПозвонить
Найти в Дзене

Кейс: Как агентство увеличило вовлеченность в 2 раза с AI-генерацией музыки для сторис

Сторис без звука — как кино без саундтрека. Технически работает, но что-то важное пропадает. Именно это осознала команда одного российского диджитал-агентства, когда охваты росли, а вовлечённость стояла на месте. Решение нашлось в нейросетевой генерации музыки для коротких рекламных роликов и сторис. Ниже — разбор процесса на основе собирательного кейса, составленного по опыту нескольких команд: какие инструменты использовались, какую нейросеть выбрать для конкретной задачи и что из этого опыта можно применить уже сегодня. Агентство вело несколько клиентских аккаунтов в Telegram, VK и Instagram — бренды из категорий lifestyle, фитнес и еда. Визуал был сильным: качественные фотографии, динамичный монтаж, правильные пропорции кадра. Но метрики раз за разом показывали одну картину: просмотры есть, досматриваемость низкая, переходы минимальные. Гипотеза появилась после аудита контента: музыкальное сопровождение в большинстве роликов было либо стандартным стоковым треком, либо отсутствовало
Оглавление

Кейс: как агентство удвоило вовлечённость в сторис с помощью AI-генерации музыки

Сторис без звука — как кино без саундтрека. Технически работает, но что-то важное пропадает. Именно это осознала команда одного российского диджитал-агентства, когда охваты росли, а вовлечённость стояла на месте. Решение нашлось в нейросетевой генерации музыки для коротких рекламных роликов и сторис.

Ниже — разбор процесса на основе собирательного кейса, составленного по опыту нескольких команд: какие инструменты использовались, какую нейросеть выбрать для конкретной задачи и что из этого опыта можно применить уже сегодня.

Проблема: аудио убивает или спасает рекламу

Агентство вело несколько клиентских аккаунтов в Telegram, VK и Instagram — бренды из категорий lifestyle, фитнес и еда. Визуал был сильным: качественные фотографии, динамичный монтаж, правильные пропорции кадра. Но метрики раз за разом показывали одну картину: просмотры есть, досматриваемость низкая, переходы минимальные.

Гипотеза появилась после аудита контента: музыкальное сопровождение в большинстве роликов было либо стандартным стоковым треком, либо отсутствовало. Когда алгоритмы соцсетей продвигают контент с высокой удержкой, это критичная точка потерь.

Решение казалось простым — подобрать подходящую музыку. Но здесь начиналась реальная боль:

  • стоковые треки узнаваемы и вызывают ощущение «типовой рекламы»;
  • лицензированная музыка стоит денег и требует оформления прав;
  • трендовые треки быстро устаревают и порождают проблемы с авторскими правами.

Выход — генерировать музыку под конкретный ролик с нуля, с помощью ИИ. Контекст подтверждает, что это не единичный эксперимент: по данным «Кион музыка», за ноябрь 2025 — январь 2026 года число прослушиваний AI-сгенерированных треков выросло на 135%, а самый высокий спрос — у аудитории младше 18 лет.

Как строился процесс: от промпта до публикации

Шаг 1. Описание нужного настроения

Для каждого ролика копирайтер или SMM-специалист писал короткое текстовое описание — какое настроение должен передавать трек, для какой аудитории, в каком темпе. Например:

«Лёгкий, воздушный трек для сторис фитнес-клуба. Женская аудитория 25–35 лет. Утреннее настроение, мотивация без агрессии. Темп средний, около 100 BPM. Без вокала.»

Это занимало 2–3 минуты. Раньше столько же уходило только на то, чтобы зайти на стоковый сайт и сформулировать первый поисковый запрос.

Шаг 2. Генерация через AI-сервисы

Для генерации музыки агентство тестировало несколько специализированных AI-сервисов. Принцип у большинства из них схожий: вы подаёте текстовый промпт, указываете жанр, темп, настроение — и получаете готовый трек за 15–30 секунд.

Практический момент, который знаком каждому российскому маркетологу: многие зарубежные сервисы работают нестабильно из России. Вопрос «какие нейросети работают без VPN» — не теоретический, а рабочий. Агентство решало его комбинированно: часть генерации шла через прямой доступ, часть — через API-агрегаторы, которые позволяют использовать зарубежные модели без геоблоков.

Шаг 3. Доработка и монтаж

Сгенерированный трек редко шёл в публикацию без изменений. Стандартный процесс:

  • обрезка под длину ролика (15–30 секунд для сторис);
  • fade in/fade out на границах;
  • выравнивание громкости относительно голосового сопровождения.

Весь монтаж занимал 5–10 минут в простом аудиоредакторе.

-2

Результаты: что показали цифры за три месяца

После перехода на новый процесс агентство зафиксировало устойчивый рост показателей по клиентским аккаунтам. Досматриваемость сторис с кастомной AI-музыкой выросла примерно вдвое по сравнению с аналогичными роликами на стоковых треках. Engagement rate заметно поднялся.

Для контекста: похожую динамику показывают и другие кейсы на рынке. Например, ВТБ в рамках кампании с контекстной AI-аудиорекламой в музыкальных стримингах получил вовлечённость на 21% выше стандартных роликов, создав более 1500 уникальных аудиоматериалов.

Несколько практических наблюдений, которые команда вынесла из эксперимента:

Кастомная музыка не «ощущается» рекламой. Зритель не узнаёт трек как «тот самый стоковый фон», и психологический барьер «это реклама, листаем дальше» снижается.

Темп важнее жанра. Ролики с треками, где темп совпадал с ритмом монтажа, удерживали внимание дольше. AI-генерация позволяла задавать BPM точно.

Один трек — один ролик. Попытки переиспользовать удачный трек для разных брендов снижали эффект. Уникальность аудио оказалась такой же важной, как уникальность визуала.

Время производства сократилось в разы. Поиск и согласование музыки раньше занимали 30–60 минут на ролик. С AI-генерацией — 10–15 минут, включая доработку.

Какую нейросеть выбрать: практический ответ для российского рынка

Вопрос доступа к AI-инструментам в России — рабочий, а не праздный. Часть сервисов блокируется, часть требует зарубежные карты для оплаты. По данным отраслевых исследований, нейросети в 2024–2025 годах стали стандартным инструментом для подавляющего большинства рекламных агентств в стране, но вопрос «какие нейросети доступны без VPN» остаётся актуальным.

Практика показывает: самые надёжные варианты — инструменты с российской инфраструктурой или агрегаторы, которые берут на себя техническую сложность доступа к зарубежным моделям.

Здесь стоит сказать про OximoAI. Бот работает прямо в Telegram, не требует VPN, оплата в рублях через ЮKassa или Telegram Stars. Для задач, которые решало агентство из кейса, он закрывает несколько этапов процесса:

Написание промптов для музыкальных треков. Копирайтер не всегда умеет описать настроение в формате, понятном AI-генератору музыки. В OximoAI можно написать в свободной форме: «Напиши промпт для генерации музыкального трека под рекламные сторис фитнес-клуба, аудитория — женщины 25–35 лет, утреннее настроение, без вокала» — и за 15 секунд получить структурированное описание с жанром, темпом и настроением, готовое для подачи в любой музыкальный AI-генератор. Модели Gemini 2.5 Flash и DeepSeek V3 справляются с этим отлично.

Тексты и визуал для сторис. Пока генерируется музыка, в том же боте можно написать подпись, CTA, варианты для A/B-теста. Если нужны статичные сторис или превью — модели генерации изображений тоже доступны прямо в боте.

Сценарий: откройте @OximoAI_bot → напишите задачу обычным языком → выберите модель → через 15–20 секунд получите результат. Всё в одном окне, без переключения между вкладками и сервисами.

Что это значит для вашего проекта

Эта история — не про «один хак, который всё изменил». Она иллюстрирует системный сдвиг: контент, который раньше требовал нескольких специалистов и дней работы, сегодня собирается за час силами одного человека с правильным набором инструментов.

Несколько выводов, которые можно применить прямо сейчас:

  1. Аудио — не опция, а элемент удержания. Если ваши сторис и ролики выходят со стоковой музыкой или без неё — перед вами зона роста.
  2. AI-генерация музыки работает в продакшене. Это инструмент сегодняшнего дня, который использует растущее число команд.
  3. Доступ к нейросетям без VPN — решённая задача. Telegram-боты с российской инфраструктурой дают доступ к ведущим моделям без технических сложностей.
  4. Комплексный подход эффективнее точечного. Агентство выиграло не потому, что просто добавило музыку. Оно перестроило процесс так, что каждый элемент — текст, визуал, звук — создаётся быстрее и точнее под конкретную аудиторию.

Итог

Удвоение вовлечённости — не магия и не случайный вирусный ролик. Это результат системного подхода к конкретной проблеме: музыка в сторис перестала быть «чем попало» и стала частью контентной стратегии.

AI-инструменты сделали этот переход доступным даже для небольших команд без музыкального редактора в штате. Главное — выстроить процесс и выбрать инструменты, которые реально работают в российских условиях.

Хотите попробовать? Начните с малого: сгенерируйте промпт для музыкального трека или напишите текст для сторис.

Откройте @OximoAI_bot — 50 монет бесплатно при старте, карта не нужна. Через минуту у вас будет первый результат.