10,2 тыс подписчиков
✅️ Point-Bind & Point-LLM: Aligning 3D with Multi-modality
Point-Bind is a 3D multi-modality model with a joint embedding space among 3D point cloud, image, language, audio, and video.
Point-LLM - это первая мультимодальная большая языковая модель, которая не требует ввода трехмерных объектов и учитывает мультимодальный ввод для генерации🌟
📕 Paper: https://arxiv.org/abs/2309.00615v1
⭐️ Dataset: https://paperswithcode.com/dataset/esc-50
Около минуты
5 сентября 2023