10,9 тыс подписчиков

✅️ Point-Bind & Point-LLM: Aligning 3D with Multi-modality

Point-Bind is a 3D multi-modality model with a joint embedding space among 3D point cloud, image, language, audio, and video.

Point-LLM - это первая мультимодальная большая языковая модель, которая не требует ввода трехмерных объектов и учитывает мультимодальный ввод для генерации🌟

🖥 Github: https://github.com/ziyuguo99/point-bind_point-llm

⏩ Demo: http://imagebind-llm.opengvlab.com/

📕 Paper: https://arxiv.org/abs/2309.00615v1

⭐️ Dataset: https://paperswithcode.com/dataset/esc-50

ai_machinelearning_big_data

Около минуты

5 сентября 2023