2 подписчика
Китайская Alibaba показала Wan Streamer (https://youtu.be/RkNtPeylf_U). Теперь ИИ видит и слышит вас, и отвечает в режиме реального времени.
Особенность его не в новизне идеи (в США такое показывали и дают пользоваться), тут технология. По опубликованным материалам Wan-Streamer позиционируется как end-to-end модель, где язык, аудио и видео идут в одном непрерывном потоке внутри одного transformer’а, без отдельной связки ASR/LLM/TTS.
Ещё пишут про full duplex: модель может одновременно слушать и отвечать, а не просто ждать конца реплики.
P.S. Необычное чувство при воспоминаниях о чтении научно-фантастических книг, во времена, когда чудом был цветной огромный телевизор с кинескопом и дистанционным пультом управления. Привет, чаяния прошлого.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Наши площадки:
TG – https://t.me/prptut | ВК – https://vk.com/prptut | Дзен – https://dzen.ru/prptut | RT – https://rutube.ru/channel/34769099/ | YT – https://www.youtube.com/@prptut | OK – https://ok.ru/group/70000025941299 | MAX – https://max.ru/join/0sPSgkYYT-4sYtzF4Xvc-wwqFCP8qK6FA8jqWdsO0a8
Закрытый чат: https://t.me/prptut_bot
Поднять карму в Хабр, пониженную противниками русских программистов, семьи и Дня Победы, можно тут: https://habr.com/ru/users/prptut/
1 минута
27 июня