Начну с небольшого экскурса в историю вопроса. В 2016 году компания Adobe анонсировала инструмент VoCo, который был способен имитировать голос любого человека. Для этого ему был необходим образец голоса - запись длиной 20 минут. Годом после канадский стартап Lyrebird пустил бета-версию онлайн-сервиса (легко гуглится), через которую возможно научить нейро сеть имитировать любой голос. Для обучения нужна аудио-запись длиной теперь уже всего одна! минута.
В своей публикации они всякими способами подчёркивают свои чрезвычайно благие намерения, молотят себя в грудь, обещая, что "ваш голос несомненно принадлежит только вам", а они "только всего лишь обслуживание". Однако все это только слова, тем более я не отыскал ни 1-го упоминания о хотя бы гипотетической зоне внедрения такого вида технологии.
И теперь перейдем к самому интересному.
Научные работники из китайской фирмы Baidu в феврале 2018 разместили статью, в которой описывается способ к клонированию голоса, который работает на обр