Машинное обучение

9842 подписчика

DenseAV hеволюционный алгоритм, который предсказывает то, что он видит, исходя из того, что он слышит.

Около минуты

8 прочтений

11 июня

Исследователи Массачусетского технологического университета CSAIL и Google разработали алгоритм DenseAV, который предсказывает то, что он видит, исходя из того, что он слышит.

Он совершенно не контролируется и не использует текст во время обучения.

Алгоритм может соотносить объекты с видео со звуками, которые они издают.

Возможности DenseAV в области локализации основаны на новом методе dense contrastive loss, который наделяет его мощной способность запоминать и локализовывать слова и звуки по сравнению с широко распространенными методами.

DenseAV значительно превосходит известные методы семантической сегментации по речи и звуку.

▪Paper: https://arxiv.org/abs/2406.05629

▪Website: https://mhamilton.net/denseav

▪Code: https://github.com/mhamilton723/DenseAV

▪Video: https://youtu.be/wrsxsKG-4eE

@ai_machinelearning_big_data

Взгляните на эти темы

Дзен Календарь

Технологии и IT

Найти тему

Социальные сети и мессенджеры

Языки программирования

Веб-разработка

Мобильная разработка

Разработка игр

Интернет

Аналитика данных

UX/UI Дизайн

Операционные системы

Облачные технологии

Кибербезопасность

Qualcomm Incorporated

Квантовые компьютеры

Робот пылесос

Цифровая реклама (Digital Marketing)

Умные часы

Технологии и IT

363,7 тыс интересуются