1 подписчик

Имитация голоса уже реальность

13 марта 201913 мар 2019

1 мин

Начну с небольшого экскурса в историю вопроса. В 2016 году компания Adobe анонсировала инструмент VoCo, который был способен имитировать голос любого человека. Для этого ему был необходим образец голоса - запись длиной 20 минут. Годом после канадский стартап Lyrebird пустил бета-версию онлайн-сервиса (легко гуглится), через которую возможно научить нейро сеть имитировать любой голос. Для обучения нужна аудио-запись длиной теперь уже всего одна! минута.

В своей публикации они всякими способами подчёркивают свои чрезвычайно благие намерения, молотят себя в грудь, обещая, что "ваш голос несомненно принадлежит только вам", а они "только всего лишь обслуживание". Однако все это только слова, тем более я не отыскал ни 1-го упоминания о хотя бы гипотетической зоне внедрения такого вида технологии.

И теперь перейдем к самому интересному.

Научные работники из китайской фирмы Baidu в феврале 2018 разместили статью, в которой описывается способ к клонированию голоса, который работает на обр

И теперь перейдем к самому интересному.

Начну с небольшого экскурса в историю вопроса.

В 2016 году компания Adobe анонсировала инструмент VoCo, который был способен имитировать голос любого человека. Для этого ему был необходим образец голоса - запись длиной 20 минут.

Годом после канадский стартап Lyrebird пустил бета-версию онлайн-сервиса (легко гуглится), через которую возможно научить нейро сеть имитировать любой голос. Для обучения нужна аудио-запись длиной теперь уже всего одна! минута.

И теперь перейдем к самому интересному.

Научные работники из китайской фирмы Baidu в феврале 2018 разместили статью, в которой описывается способ к клонированию голоса, который работает на образцах протяженностью всего-то 3.7 сек.!!!! Качественность итога в таком случае, разумеется хреновое, но разработка-то продолжается...

Так что, уважаемые читатели, жажду предупредить всех вас, что уже в ближайшее время телефонные аферисты сумеют перейти на сверхновый уровень. И теперь вместо смс сообщения от "сына/дочери/внука/.." с мольбой быстро положить денежные средства на телефон, они попросту позвонят. И для генерирования вашего голоса применят запись вашего разговора с какой-либо службой поддержки, "ненамеренно" пропавшей в публичный доступ. Будьте аккуратны!