Стартап Suno AI, предлагающий фирменную нейросеть для генерации музыки, включая вокал, на этой неделе должен получить крупное обновление, а немного позже – новую функцию для преобразования аудио в аудио. Такими анонсами поделились сами разработчики в Discord и на своём официальном сайте.
Обновление подразумевает переход от нынешней версии 3.0 к 3.5. Вместе с ним Suno AI научится создавать музыку длиной до четырёх минут вместо нынешних двух, которыми ограничена версия 3.0. Отметим, что лимит в две минуты можно было преодолевать и раньше, позволяя сервису поэтапно продолжать уже сгенерированные композиции. Или же можно было генерировать разные мелодии, затем «склеивая» их вручную в любом аудиоредакторе.
Однако теперь пользоваться сервисом станет заметно удобнее. В четыре минуты можно будет уместить уже весьма солидный по объёму текст, так что в большинстве случаев песня будет генерироваться одним цельным фрагментом. Если же четырёх минут всё равно мало, то упомянутая выше возможность продления теперь тоже действует в два раза дольше: две минуты вместо одной.
Сообщение о версии 3.5 начинается с упоминания 4.0, которая уже обучается. Также авторы просят активнее ставить в Discord дизлайки под неудачными треками для улучшения работы модели.
Дополнительно разработчики обещают для версии 3.5 улучшенную структуру песен и улучшенный вокальный поток.
Наконец, было анонсировано преобразование аудио в аудио. Его в 3.5, по всей видимости, не будет: функция станет доступна чуть позже, пройдя предварительное бета-тестирование. В первой демонстрации авторы буквально «настучали» мелодию на металлической балконной трубе, которую нейросеть превратила в весьма качественную музыкальную композицию.
Пока неясно, ограничится ли новая функция лишь настукиванием, насвистыванием и чем-то подобным или же нас ждёт нечто большее, что позволит создавать полноценные ремиксы для уже имеющихся песен.
Интерфейс веб-версии Suno AI. При активации режима Custom Mode (переключатель слева вверху) появится поле для вставки собственного текста.
Напомним, Suno AI громко заявила о себе ещё осенью прошлого года. Пользователь может создавать как чисто инструментальные композиции, так и полноценные песни с мужским или женским вокалом. Нейросеть практически всё позволяет бесплатно, причём новые бесплатные баллы начисляются каждый день. Есть поддержка русского языка. По умолчанию нейросеть «поёт» на английском, но если вы вставите русский текст – «нейронка» с этим справится.
Качественные композиции порой получаются далеко не с первого раза, но если уделить нейросети достаточно времени, то результат выходит на удивление неплохим. Генерировать можно как на официальном сайте, так и через бота в Discord.
Около полугода Suno AI были практически вне конкуренции, однако за последние месяцы конкуренты уже дали о себе знать. К ним можно отнести новую нейросеть Udio, которая сейчас работает с багами и серьёзными ограничениями, но зато способна выдавать порой более качественный звук, чем Suno.
Udio – один из главных конкурентов Suno на сегодняшний день, увы, пока ещё скован лимитами в 33 секунды аудио на каждую песню.
Также на горизонте собственный генератор песен от ElevenLabs – известной на западе нейросети, которая завоевала популярность функциями клонирования голоса. Наконец, OpenAI обещает добавить возможность петь в обновлённый голосовой режим для ChatGPT, который развернут в ближайшие месяцы. На этом фоне Suno AI уже анонсировали следующее обновление – V4, которое, по всей видимости, не заставит себя долго ждать.