НЕЙРОСФЕРА

3236 подписчиков

HumanOmniV2 — ИИ, который понимает и видео, и звук, и текст одновременно

8 июля8 июл

3

~1 мин

HumanOmniV2 — ИИ, который понимает и видео, и звук, и текст одновременно 😮

На Hugging Face появилась информация о новой модели от PhilipC — HumanOmniV2. Её основная фишка — анализ мультимодальных данных: видео, аудио и текстов одновременно, с полным пониманием контекста.

Что делает:

— Понимает видео с диалогами, распознаёт, кто говорит, что происходит, что звучит в кадре;

— Может ответить на вопросы по ролику (например: «Что произошло после того, как человек в красном заговорил?»);

— Работает как ассистент-аналитик: даёшь видео — получаешь суть, действия, намерения, речь, шумы и события.

#нейросети #ИИ #нейросеть #искусственный_интеллект

Взгляните на эти темы

Нейронные сети (Neural Networks)

Кибербезопасность

Найти тему

Форум «Цифровые решения»

Технологии будущего

Технологии в социальной сфере

Робототехника

Нанотехнологии

Веб-разработка

Разработка игр

Интернет

IT (информационные технологии)

Машинное обучение (Machine Learning)

Социальные сети и мессенджеры

Технологии в финансах

Интернет вещей (IoT)

Технологии в медицине

Языки программирования

Мобильная разработка

Системное администрирование

IT (информационные технологии)

5,67 млн интересуются