Добавить в корзинуПозвонить
Найти в Дзене

Xiaomi научила ИИ копировать ваш голос по трёхсекундной записи

Xiaomi выпустила OmniVoice, открытую модель, которая клонирует голос по 3 секундам записи. OmniVoice поддерживает 600 языков (русский есть в списке). Голос переносится на любой из них с сохранением тембра и интонации оригинала. Скорость генерации в 40 раз выше реального времени, это достигается за счет объединения нескольких этапов обработки в один. Помимо клонирования, модель позволяет описать голос текстом: например, "низкий голос с британским акцентом". Также поддерживается вставка естественного смеха и других звуков прямо в середину фразы. @bykorolev

Xiaomi научила ИИ копировать ваш голос по трёхсекундной записи

Xiaomi выпустила OmniVoice, открытую модель, которая клонирует голос по 3 секундам записи.

OmniVoice поддерживает 600 языков (русский есть в списке). Голос переносится на любой из них с сохранением тембра и интонации оригинала.

Скорость генерации в 40 раз выше реального времени, это достигается за счет объединения нескольких этапов обработки в один.

Помимо клонирования, модель позволяет описать голос текстом: например, "низкий голос с британским акцентом". Также поддерживается вставка естественного смеха и других звуков прямо в середину фразы.

@bykorolev