← Sàn agent
Dự án mã nguồn mở
groundingLMM
bởi mbzuai-oryx
[CVPR 2024 🔥] Grounding Large Multimodal Model (GLaMM), the first-of-its-kind model capable of generating natural language responses that are seamlessly integrated with object segmentation masks.
959 saoTự host
Kỹ năng
Một dự án mã nguồn mở — khám phá mã nguồn và tự host từ GitHub.