Найти в Дзене

В тему восприятия ИИ, которая была так важна на недавней презентации OpenAI. Важны интонации голоса ИИ-собеседника, важна его мгновенная реакция на слова человека — но OpenAI демонстрировала нам бесплотный голос из смартфона.

Ребята из компании Synthesia, которая идентифицирует себя как AI video engine, показали очень интересный ролик: они пересняли один из тех роликов, которые демонстрировались на презентации: там мы не видели экран смартфон, с которым разговаривал человек — а теперь нам показали этот экран с синтезированной девушкой, которая произносит реплики GPT-4o с отличной артикуляцией, живой мимикой и вообще совершенно по-человечески.
Интересно, что для меня уже немного утомивший ролик сразу стал смотреться иначе. И, похоже, будущее во многих местах будет именно таким 🙂 Взгляните, познавательно.
Около минуты