10,2 тыс подписчиков
🔄 Caption Anything: Interactive Image Description with Diverse Multimodal Controls
Caption-Anything is a versatile tool combining image segmentation, visual captioning, and ChatGPT, generating tailored captions with diverse controls for user preferences.
Универсальный инструмент для работы с изображениями, сочетающий в себе возможности, Visual Captioning, SAM, ChatGPT. Модель генерирует описательные подписи для любого объекта на изображении.
⏩ Paper: https://arxiv.org/abs/2305.02677v1
Около минуты
7 мая 2023