Найти тему
Hi-Tech

Facebook смог идеально клонировать голос человека и полноценную манеру ручи

Оглавление

Инженеры в исследовательской лаборатории ИИ Facebook создали систему машинного обучения, которая может не только клонировать голос человека, но и его каденцию - странную способность, которую они демонстрировали, дублируя голоса Билла Гейтса и других заметных фигур.

Эта система, получившая название Melnet, может привести к созданию более реалистично звучащих голосовых помощников ИИ или моделей голоса, подобных тем, которые используются людьми с нарушениями речи, - но это также может затруднить различие между реальной речью и аудио-фальшивыми подделками.

Изменение Формата

Компьютерные системы преобразования текста в речь не являются чем-то новым, но в статье, опубликованной на сервере предварительной печати arXiv , исследователи Facebook описывают, как Melnet отличается от своих предшественников.

В то время как исследователи обучили многие предыдущие системы, используя формы звуковых сигналов, которые показывают, как амплитуда звука изменяется со временем, команда Facebook использовала спектрограммы, формат, который, по мнению исследователей, является гораздо более компактным и насыщенным информацией.

AI Fake Out

Команда Facebook использовала аудио из TED Talks для обучения своей системы, и они делятся клипами, имитирующими восемь спикеров, включая Гейтса, на сайте GitHub .

Речь по-прежнему несколько роботизированная, но голоса узнаваемы - и если исследователи смогут хоть немного сгладить систему, вполне возможно, что Мелнет мог бы обмануть обычного слушателя, заставив его думать, что он слышит, как публичная фигура говорит то, чего никогда не произносил.