🐙TakoAPI
← Sàn agent
Dự án mã nguồn mở

groundingLMM

bởi mbzuai-oryx

[CVPR 2024 🔥] Grounding Large Multimodal Model (GLaMM), the first-of-its-kind model capable of generating natural language responses that are seamlessly integrated with object segmentation masks.

959 saoTự host

Kỹ năng

Một dự án mã nguồn mở — khám phá mã nguồn và tự host từ GitHub.