У Fall Out Boy ушло несколько месяцев, бесчисленные черновики и продюсер, которого им пришлось уговаривать, чтобы записать Sugar, We're Goin Down. Они начали писать песню в маленькой репетиционной в Чикаго, прошли через огромное количество итераций, и многие из них были, по их же словам, "довольно плохими". А я попросил нейросеть сделать что-то похожее. Одним сообщением. И с первой попытки получил трек, который хочется переслушать.
Алоха, меломаны! С вами канал "ЧистоМузыка". И добро пожаловать в третий выпуск рубрики, где мы создаем ИИ треки бесплатно и быстро. Сегодня - самый быстрый и ленивый способ из всех, что я показывал. Но по результату так сразу и не скажешь.
Если вы пропустили первые два выпуска - они вот здесь: генерация трека с нуля, пример создания трека. Там база, без которой третий выпуск будет как третий сезон без первых двух.
Проблема с прошлыми методами
В первых двух выпусках мы работали по схеме: промт → вопросы от ИИ → подробные ответы → готовый текст → Suno. Это работает хорошо. Но честно признаюсь: когда нейросеть выкатила мне 22 вопроса подряд, у меня было одно желание - закрыть вкладку и заварить чай.
Потому что "укажи желаемый BPM", "опиши динамику второго куплета" и "какова метрическая структура припева" - это не разговор с продюсером. Это экзамен по теории музыки, который я не сдавал.
Поэтому я схитрил. И вот что из этого вышло.
Шаг 1. Открываем старый чат и сразу к делу
Я не начинал новый диалог с нуля. Я открыл один из прошлых чатов с нейросетью (там уже был весь контекст о том, как работает Suno, какие теги нужны, какую структуру соблюдать) и написал просто:
Готовим новый трек
Нейросеть сразу выдала список из 22 вопросов. Я посмотрел на него и написал вот что (см. скриншот 1).
Всё. Одно сообщение вместо 22 ответов.
Почему именно этот трек? "Sugar, We're Goin Down" считается одной из жанрообразующих песен поп-панка и эмо. Ее называли одной из самых влиятельных поп-панк-песен всех времён - песней, которая "сформировала жанр" и "дала последующим группам повод писать творчески". Проще говоря - это идеальный шаблон. Чёткая структура, узнаваемый вайб, мощный припев. Именно то, что хорошо поддаётся "копированию" через нейросеть. А еще я просто в тот момент на нее подсел. И захотел что-то подобное создать.
Шаг 2. Нейросеть задаёт уточняющие вопросы (их уже не 22)
После моего сообщения нейросеть не стала грузить меня экзаменом. Она задала 4 уточняющих вопроса - только то, чего ей реально не хватало (см. скриншот 2). Я ответил коротко, без лишних деталей.
Это и есть главный лайфхак третьего выпуска. Вместо того чтобы отвечать на всё подряд, вы описываете желаемый результат через референс - песню, которую все знают. Нейросеть понимает структуру, темп, эмоцию и стиль вокала из одного названия лучше, чем из двадцати ваших ответов про BPM и "динамику куплета".
Важно: референс работает именно потому, что нейросеть "слышала" миллионы треков во время обучения. Голос Патрика Стампа по праву считается одним из лучших в поп-панке - и нейросеть знает, что это значит технически: какая подача, какая эмоция, какая энергетика. Вы не объясняете, вы показываете пальцем.
Шаг 3. Получаем инструкцию - и сразу в Suno
Нейросеть выдала готовый пакет: текст песни на русском с сохранённой структурой оригинала и описание стиля для Suno (см. скриншот 3).
Пару вещей, на которые я обратил внимание:
- По тексту: нейросеть не переводила оригинал дословно (это было бы плохо). Она взяла смысл и эмоцию - ту самую смесь юношеской дерзости, романтики и лёгкого надрыва, которая есть в оригинале. И переупаковала её в русские строчки. Рифмы получились живыми, без "луна-струна" и прочего, от чего морщишься.
- По стилю: в описании для Suno нейросеть точно прописала: поп-панк, драйвовые гитары, мужской тенор с хрипотцой в стиле Патрика, энергичный темп. Всё то, что делает Sugar узнаваемой, но в своей интерпретации.
Конкретное описание стиля можно глянуть ниже (см. скриншот 4).
Шаг 4. Первая попытка - и она последняя
Обычно я говорю: готовьтесь к нескольким итерациям. В прошлом выпуске мне понадобилось три захода, чтобы довести хронометраж до нужного.
На этот раз - с первой попытки.
Включаю первый вариант - и сразу понятно: это оно. Гитары звучат так, как нужно. Голос попал в нужный тембр. Структура держится. Энергия в припеве такая, что хочется кивать головой.
Весь процесс - от "Готовим новый трек" до готового файла занял около 10 минут.
Трек можно послушать прямо здесь:
Почему этот метод работает лучше предыдущих
Подведу итог в трёх пунктах - для тех, кто любит конкретику:
1. Референс > описание. Одно название известного трека даёт нейросети больше информации, чем десять абзацев про "хочу энергично, но не слишком, и чтобы был бит, но не тяжело". Нейросеть знает Sugar, We're Goin Down лучше, чем вы можете описать словами то, что у вас в голове.
2. Продолжение старого чата > новый диалог. Когда нейросеть уже знает, как работает Suno, какие теги нужны и какой формат вывода вам нужен, она не тратит время на разогрев. Первое же сообщение попадает в цель.
3. Меньше вопросов - лучше результат. Звучит парадоксально, но это правда. Когда вы отвечаете на 22 вопроса, вы начинаете выдумывать детали, которых сами не знаете. "Какой BPM?" - "Ну, наверное, 130?" - и нейросеть делает именно 130, даже если вам нужно было 145. Референс устраняет эту проблему: нейросеть берёт правильные параметры сама.
Попробуйте прямо сейчас
Схема максимально простая:
- Открываете чат с нейросетью (Qwen, Claude, ChatGPT - любой)
- Пишете: "Ты - музыкальный продюссер и композитор. Я хочу создать трек, похожий на [название песни]. Язык русский, вокал [мужской/женский]. Рифмы живые, без банальностей. Структура как в оригинале. Если чего-то не хватит - спроси"
- Отвечаете на 2–3 уточняющих вопроса
- Вставляете результат в Suno
Всё. Десять минут - и ваш трек готов.
Какой референс возьмёте вы? Пишите в комментариях - интересно посмотреть, что получится. И подписывайтесь на канал, дальше будет еще интереснее! Увидимся, всем Музыки :)