В конце января 2025 года исследователи из HKUST и M-A-P представили YuE — семейство ИИ-моделей с открытым исходным кодом, способных генерировать полноценные пятиминутные песни из текста. На фоне судебных исков к таким гигантам, как Suno и Udio, YuE предлагает прозрачную и легально доступную альтернативу для музыкантов и разработчиков, так как распространяется по лицензии Apache 2.0 через GitHub (https://github.com/multimodal-art-projection/YuE). Как работает YuE: фокус на качестве и когерентности YuE построен на архитектуре LLaMA 2 и обучен на триллионах токенов. Способность модели сохранять целостность на протяжении нескольких минут достигается за счёт нескольких ключевых инноваций: ▫️ Разделение дорожек (track-decoupled next-token prediction). Модель обрабатывает вокал и аккомпанемент как отдельные, параллельные потоки. Это предотвращает искажение вокала в плотных инструментальных секциях (например, в метале) и обеспечивает чистоту текста. ▫️ Структурное кондиционирование (structural
📖 YuE: новый музыкальный ИИ с открытым кодом бросает вызов Suno и Udio
13 августа 202513 авг 2025
146
3 мин