Новое исследование показало, что технология синтеза речи на основе ИИ достигла уровня, когда создаваемые ею «голосовые клоны» (дипфейки) воспринимаются слушателями как такие же реалистичные, как и записи настоящих людей. Работа, проведённая учёными из Лондонского университета королевы Марии (QMUL), была опубликована в журнале PLOS One. Многие до сих пор считают, что речь, сгенерированная ИИ, звучит «неестественно» и её легко отличить от человеческого голоса. Однако исследование, в котором сравнивали настоящие голоса с двумя типами синтетических — клонированными (созданными для имитации конкретного человека) и общими (генерируемыми крупной голосовой моделью) — показало, что эта эпоха прошла. Участники эксперимента оценивали голоса по реалистичности, доминированию и надёжности. Выяснилось, что слушателям крайне сложно отличить клонированные ИИ-голоса от человеческих. Оба типа ИИ-голосов были оценены как более доминирующие, чем человеческие, а некоторые синтетические голоса также восприни