Вышла новая интересная модель для генерации музыки — DiffRhythm. Она уже успела вызвать немало шума, а некоторые даже поспешили назвать ее «убийцей Suno». Но так ли это на самом деле? DiffRhythm действительно впечатляет — она способна создавать полноценные музыкальные композиции с вокалом и аккомпанементом неожиданно быстро. Песня длительностью почти пять минут генерируется всего за десять секунд. Модель использует диффузионную архитектуру, из-за чего достигает относительно высокого качества звука и разборчивости вокала (об этом дальше). Но спешить с выводами пока не стоит. Технология новая, и недостатков у неё пока довольно много. Качество сгенерированных треков оставляет желать лучшего, вокал получается плавающий, слова съедаются, голос как из бочки и неестественный, много режущих звуков. На данный момент модель лучше всего справляется с инструментальной музыкой, и то с оговорками. Попробовать самим можно на HuggingSpace. Очень странной для пользователей остаётся схема работы, когда