2795 подписчиков
VideoScore улучшит понимание видео искусственным интеллектом
Исследователь Дунфу Цзян из Университета Ватерлоо представил VideoScore - первую в своем роде модель для точной и надежной оценки задач генерации текста в видео.
VideoScore обучен на VideoFeedback, крупномасштабном наборе данных с подробными оценками человеческой обратной связи для генерации текста в видео (T2V).
Модель VideoScore превосходит GPT-4 и Gemini почти на 20% по точности оценки на четырех бенчмарках. Она выдает оценки по 5 ключевым параметрам, таким как визуальное качество, временная согласованность и соответствие тексту.
Исследователи считают, что VideoScore станет важным вкладом в развитие моделей генерации текста в видео, которые до сих пор отставали в области обучения с подкреплением на основе человеческой обратной связи.
#FREEDUROV
Около минуты
16 сентября 2024