Найти тему
50 подписчиков

Я вот недавно услышал о существовании VALL-E, софта, которому требуется всего три, как утверждают разработчики, секунды, чтобы сымитировать голос говорящего.

Искусственный интеллект научили генерировать радующие глаз изображения, составлять вполне конкурентоспособные тексты и, как оказывается, очень неплохо копировать человеческий голос.

VALL-E может имитировать даже интонации и эмоции, сопровождающие говорящего.

Как по мне, возможности разработки впечатляют, но они несут и серьезную угрозу, при злонамеренном применении.
Около минуты