Вообще не понятно, с одной стороны зачем проводить в этом направлении исследования, а с другой стороны... Где-то писал уже что сейчас очень хорошо строятся вопросно-ответные системы и используется для этого RAG и здорово если у нас дополнительно в базе знаний будут еще видео, а не только тексты. P.S. Оказывается очень много проводится различных исследований в области прикладного ИИ. Читаю и планирую делиться.
В сфере исследований по искусственному интеллекту наткнулся на тему суммаризации длинных видео и ответов на вопросы по видео
ВчераВчера
~1 мин