Xiaomi выпустила OmniVoice, открытую модель, которая клонирует голос по 3 секундам записи. OmniVoice поддерживает 600 языков (русский есть в списке). Голос переносится на любой из них с сохранением тембра и интонации оригинала. Скорость генерации в 40 раз выше реального времени, это достигается за счет объединения нескольких этапов обработки в один. Помимо клонирования, модель позволяет описать голос текстом: например, "низкий голос с британским акцентом". Также поддерживается вставка естественного смеха и других звуков прямо в середину фразы. @bykorolev
Xiaomi научила ИИ копировать ваш голос по трёхсекундной записи
3 дня назад3 дня назад
14
~1 мин