Найти тему
2795 подписчиков

VideoScore улучшит понимание видео искусственным интеллектом


Исследователь Дунфу Цзян из Университета Ватерлоо представил VideoScore - первую в своем роде модель для точной и надежной оценки задач генерации текста в видео.

VideoScore обучен на VideoFeedback, крупномасштабном наборе данных с подробными оценками человеческой обратной связи для генерации текста в видео (T2V).

Модель VideoScore превосходит GPT-4 и Gemini почти на 20% по точности оценки на четырех бенчмарках. Она выдает оценки по 5 ключевым параметрам, таким как визуальное качество, временная согласованность и соответствие тексту.

Исследователи считают, что VideoScore станет важным вкладом в развитие моделей генерации текста в видео, которые до сих пор отставали в области обучения с подкреплением на основе человеческой обратной связи.



#FREEDUROV
VideoScore улучшит понимание видео искусственным интеллектом  Исследователь Дунфу Цзян из Университета Ватерлоо представил VideoScore - первую в своем роде модель для точной и надежной оценки задач...
Около минуты