29 подписчиков

Я дал ИИ один референс. И через 10 минут у меня готов полноценный трек

17 апреля17 апр

4 мин

У Fall Out Boy ушло несколько месяцев, бесчисленные черновики и продюсер, которого им пришлось уговаривать, чтобы записать Sugar, We're Goin Down. Они начали писать песню в маленькой репетиционной в Чикаго, прошли через огромное количество итераций, и многие из них были, по их же словам, "довольно плохими". А я попросил нейросеть сделать что-то похожее. Одним сообщением. И с первой попытки получил трек, который хочется переслушать. Алоха, меломаны! С вами канал "ЧистоМузыка". И добро пожаловать в третий выпуск рубрики, где мы создаем ИИ треки бесплатно и быстро. Сегодня - самый быстрый и ленивый способ из всех, что я показывал. Но по результату так сразу и не скажешь. Если вы пропустили первые два выпуска - они вот здесь: генерация трека с нуля, пример создания трека. Там база, без которой третий выпуск будет как третий сезон без первых двух. В первых двух выпусках мы работали по схеме: промт → вопросы от ИИ → подробные ответы → готовый текст → Suno. Это работает хорошо. Но честно при

Оглавление

Проблема с прошлыми методами
Шаг 1. Открываем старый чат и сразу к делу
Шаг 2. Нейросеть задаёт уточняющие вопросы (их уже не 22)

У Fall Out Boy ушло несколько месяцев, бесчисленные черновики и продюсер, которого им пришлось уговаривать, чтобы записать Sugar, We're Goin Down. Они начали писать песню в маленькой репетиционной в Чикаго, прошли через огромное количество итераций, и многие из них были, по их же словам, "довольно плохими". А я попросил нейросеть сделать что-то похожее. Одним сообщением. И с первой попытки получил трек, который хочется переслушать.

Алоха, меломаны! С вами канал "ЧистоМузыка". И добро пожаловать в третий выпуск рубрики, где мы создаем ИИ треки бесплатно и быстро. Сегодня - самый быстрый и ленивый способ из всех, что я показывал. Но по результату так сразу и не скажешь.

Если вы пропустили первые два выпуска - они вот здесь: генерация трека с нуля, пример создания трека. Там база, без которой третий выпуск будет как третий сезон без первых двух.

Проблема с прошлыми методами

В первых двух выпусках мы работали по схеме: промт → вопросы от ИИ → подробные ответы → готовый текст → Suno. Это работает хорошо. Но честно признаюсь: когда нейросеть выкатила мне 22 вопроса подряд, у меня было одно желание - закрыть вкладку и заварить чай.

Потому что "укажи желаемый BPM", "опиши динамику второго куплета" и "какова метрическая структура припева" - это не разговор с продюсером. Это экзамен по теории музыки, который я не сдавал.

Поэтому я схитрил. И вот что из этого вышло.

Шаг 1. Открываем старый чат и сразу к делу

Я не начинал новый диалог с нуля. Я открыл один из прошлых чатов с нейросетью (там уже был весь контекст о том, как работает Suno, какие теги нужны, какую структуру соблюдать) и написал просто:

Готовим новый трек

Нейросеть сразу выдала список из 22 вопросов. Я посмотрел на него и написал вот что (см. скриншот 1).

Всё. Одно сообщение вместо 22 ответов.

Почему именно этот трек? "Sugar, We're Goin Down" считается одной из жанрообразующих песен поп-панка и эмо. Ее называли одной из самых влиятельных поп-панк-песен всех времён - песней, которая "сформировала жанр" и "дала последующим группам повод писать творчески". Проще говоря - это идеальный шаблон. Чёткая структура, узнаваемый вайб, мощный припев. Именно то, что хорошо поддаётся "копированию" через нейросеть. А еще я просто в тот момент на нее подсел. И захотел что-то подобное создать.

Шаг 2. Нейросеть задаёт уточняющие вопросы (их уже не 22)

После моего сообщения нейросеть не стала грузить меня экзаменом. Она задала 4 уточняющих вопроса - только то, чего ей реально не хватало (см. скриншот 2). Я ответил коротко, без лишних деталей.

Это и есть главный лайфхак третьего выпуска. Вместо того чтобы отвечать на всё подряд, вы описываете желаемый результат через референс - песню, которую все знают. Нейросеть понимает структуру, темп, эмоцию и стиль вокала из одного названия лучше, чем из двадцати ваших ответов про BPM и "динамику куплета".

Важно: референс работает именно потому, что нейросеть "слышала" миллионы треков во время обучения. Голос Патрика Стампа по праву считается одним из лучших в поп-панке - и нейросеть знает, что это значит технически: какая подача, какая эмоция, какая энергетика. Вы не объясняете, вы показываете пальцем.

Шаг 3. Получаем инструкцию - и сразу в Suno

Нейросеть выдала готовый пакет: текст песни на русском с сохранённой структурой оригинала и описание стиля для Suno (см. скриншот 3).

Пару вещей, на которые я обратил внимание:

По тексту: нейросеть не переводила оригинал дословно (это было бы плохо). Она взяла смысл и эмоцию - ту самую смесь юношеской дерзости, романтики и лёгкого надрыва, которая есть в оригинале. И переупаковала её в русские строчки. Рифмы получились живыми, без "луна-струна" и прочего, от чего морщишься.
По стилю: в описании для Suno нейросеть точно прописала: поп-панк, драйвовые гитары, мужской тенор с хрипотцой в стиле Патрика, энергичный темп. Всё то, что делает Sugar узнаваемой, но в своей интерпретации.

Конкретное описание стиля можно глянуть ниже (см. скриншот 4).

Шаг 4. Первая попытка - и она последняя

Обычно я говорю: готовьтесь к нескольким итерациям. В прошлом выпуске мне понадобилось три захода, чтобы довести хронометраж до нужного.

На этот раз - с первой попытки.

Включаю первый вариант - и сразу понятно: это оно. Гитары звучат так, как нужно. Голос попал в нужный тембр. Структура держится. Энергия в припеве такая, что хочется кивать головой.

Весь процесс - от "Готовим новый трек" до готового файла занял около 10 минут.

Трек можно послушать прямо здесь:

Почему этот метод работает лучше предыдущих

Подведу итог в трёх пунктах - для тех, кто любит конкретику:

1. Референс > описание. Одно название известного трека даёт нейросети больше информации, чем десять абзацев про "хочу энергично, но не слишком, и чтобы был бит, но не тяжело". Нейросеть знает Sugar, We're Goin Down лучше, чем вы можете описать словами то, что у вас в голове.

2. Продолжение старого чата > новый диалог. Когда нейросеть уже знает, как работает Suno, какие теги нужны и какой формат вывода вам нужен, она не тратит время на разогрев. Первое же сообщение попадает в цель.

3. Меньше вопросов - лучше результат. Звучит парадоксально, но это правда. Когда вы отвечаете на 22 вопроса, вы начинаете выдумывать детали, которых сами не знаете. "Какой BPM?" - "Ну, наверное, 130?" - и нейросеть делает именно 130, даже если вам нужно было 145. Референс устраняет эту проблему: нейросеть берёт правильные параметры сама.

Попробуйте прямо сейчас

Схема максимально простая:

Открываете чат с нейросетью (Qwen, Claude, ChatGPT - любой)
Пишете: "Ты - музыкальный продюссер и композитор. Я хочу создать трек, похожий на [название песни]. Язык русский, вокал [мужской/женский]. Рифмы живые, без банальностей. Структура как в оригинале. Если чего-то не хватит - спроси"
Отвечаете на 2–3 уточняющих вопроса
Вставляете результат в Suno

Всё. Десять минут - и ваш трек готов.

Какой референс возьмёте вы? Пишите в комментариях - интересно посмотреть, что получится. И подписывайтесь на канал, дальше будет еще интереснее! Увидимся, всем Музыки :)