Нейросеть выдаёт трек за минуту, но слушать его скучно: всё идеально ровно, без дыхания, без движения. Голос склеенный, ритм как под линейку, инструменты звучат одинаково от куплета к припеву.
Проблема часто не в самой нейросети, а в том, как сформулирован запрос. Ниже — фразы для промптов, которые добавляют в музыку динамику, дыхание и пространство. А ещё я расскажу, какие слова делают звук пластиковым и на что их заменить, чтобы трек звучал человечнее.
12 формулировок для запроса ИИ
1. Живой темп, не по линейке. «Slight tempo variations» или «естественные колебания темпа». ИИ начнёт слегка ускоряться к припеву и замедляться в куплетах. Это убирает ощущение метронома.
2. Динамика с дыханием. «Dynamic contrast, quiet verses, louder chorus» вместо просто «loud». Когда куплет тише и ближе, а припев шире и мощнее, музыка перестаёт давить.
3. Микронеровности композиции. «Slightly varied note attacks» или «не идеально ровные удары». Если каждый удар ритм-секции повторяется одинаково, звук становится игрушечным. Небольшая разница в силе и длительности убирает ощущение копипаста.
4. Артикуляция вокала как у живого человека. «Clear consonants, natural breathing, soft phrase endings». Склеенные слоги и отсутствие дыхания делают голос похожим на робота. А когда слышны придыхания и мягкие переходы, голос становится живым.
5. Живой грув, чуть за долю. «Slightly off-grid kick and snare» или «human groove, not quantized». Идеально ровное исполнение убивает живой ритм и драйв. Лёгкое смещение звука бочки или баса создаёт грув, от которого хочется кивать.
Грув (от англ. groove — «канавка», «выемка») в музыке — это интуитивное чувство ритма или ритмический слой, возникающий при звучании тщательно вымеренных и совместно действующих ритмов, что вызывает у слушателей желание притопывать, хлопать или танцевать. Он делает музыку «дышащей» и создаёт ощущение движущегося фона, благодаря чему композиция становится живой и пульсирующей.
6. Реальная комната и расстояние до микрофона. «Sense of room, close mic on vocal, distant mic on drums». Без пространства трек звучит плоско, все инструменты в одной плоскости. Когда инструменты расставлены по расстоянию и слышно лёгкое эхо комнаты, появляется объём.
7. Инструменты с характером, не универсальные. «Acoustic guitar with pick noise», «piano with mechanical clicks», «strings with bow scratches». Конкретика тембра и поведения инструмента делает звук узнаваемым. Гитара скрипит медиатором, пианино щёлкает механикой — эти мелочи убирают пластиковость.
8. Драйв через живые удары, не через «сильнее и быстрее». «Accented hits, nervous rhythm, fill-in drums» вместо «максимально мощно». Энергия растёт за счёт рисунка и акцентов партии ударных: барабаны вставляют заполняющие удары, ритм нервничает.
9. Грусть через простоту и хрупкость. «Minimalistic, pauses, fragile dynamics, sparse arrangement». Уберите «эпично» и «кинематографично» — они перегружают аранжировку. Грусть держится на тишине между нотами и тонкой динамике.
10. Романтика через мягкую подачу. «Warm timbre, smooth transitions, delicate ornaments, intimate». Избегайте фразы «идеально чистый вокал» — стерильность убивает теплоту. Романтика живёт в мягкости и близости голоса.
11. Расслабление через ровное тепло. «Warm highs, soft transients, unhurried dynamics». Не используйте слова «кристально чистый» и «супер-высокое качество» — они делают звук холодным и резким на слух. Для спокойного настроения нужен мягкий, тёплый звук, который не режет слух.
12. Тревога через напряжение и несовершенство. «Dissonant chords, trembling textures, unstable rhythm and space». Исключите «чисто, ровно, идеально» — они убивают тревожную атмосферу. Тревога рождается из диссонансов и дрожащих фактур.
Реальная история
Рэпер Смоки Мо в работе над альбомом «Кара-Тэ 2» использовал нейросети для создания припева в треке «Падать в небо» — от текста и до вокала.
«Мне не надо теперь заниматься диггингом, что-то там искать. Теперь это делают нейросети. Я сотрудничаю с нейросетями уже профессионально. Уже знаю, какой результат я хочу», — рассказал артист.
Это подтверждает: правильные промпты и понимание процесса дают результат, который можно публиковать.
Пробуем сами
Используйте наши 12 фраз, и они сделают перевод с громких прилагательных в запросе на детали исполнения. Движение, несовершенство, пространство — вот что создаёт живое звучание. Замена пары слов на конкретику меняет результат сильнее, чем смена жанра.
Треки перестают быть одинаковыми, эмоция начинает считываться с первых секунд. Попробуйте переписать один запрос прямо сейчас: выберите настроение, добавьте две-три фразы из списка и уберите слова, которые дают стерильность.
Не забудьте подписаться на канал, чтобы не пропустить другие полезные советы по работе с ИИ!!!