1 год назад
InternVideo2: ИИ нейросеть для описания и распознавания видео от OpenGVLab
Команда OpenGVLab выпустила в открытый доступ две новые модели, которые могут помогать в работе с видео: Эти модели могут отвечать на вопросы о содержимом видео и давать текстовые описания того, что происходит на экране. Они базируются на мощной нейросети под названием Mistral-7B и специально разработаны для понимания контекста видео. Как они обучались: Эти шаги делают модели способными давать точные ответы на вопросы о видео и описывать сложные сцены. Различие между двумя моделями в том, что версия...