Компания Microsoft заявила о создании ИИ нового типа, который может с легкостью генерировать реалистично звучащую речь со всеми необходимыми интонациями. Инструмент получил имя «VALL-E». Самое любопытное, что ему достаточно проанализировать всего 3 секунды аудиозаписи голоса любого человека, чтобы идеально его скопировать. Microsoft не раскрывает принципов работы нового ИИ, не собирается выкладывать его исходные коды и даже вряд ли создаст на основе VALL-E публичный коммерческий инструмент. Скорее, это эксперимент, промежуточная стадия в разработке дополнения к другой языковой модели – GPT-3. Конечной целью Microsoft, вероятно, является создание универсального генератора речи, который мог бы заменить работу людей при создании произвольного контента. Главной сложностью, и разработчики этого не скрывают, является необходимость создать некие маркеры, которые помогли бы различать голос ИИ от голосов реальных людей. Иначе такой инструмент быстро найдет применение у злоумышленников, ведь дос
Новый ИИ Microsoft способен скопировать голос человека всего из трех секунд аудиозаписи
17 января 202317 янв 2023
16
1 мин