← Sàn agent
Dự án mã nguồn mở
AgentBench
bởi THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Kịch bản:🔍Nghiên cứu & Tìm kiếm
3.495 saoTự host
Kỹ năng
Một dự án mã nguồn mở — khám phá mã nguồn và tự host từ GitHub.
bởi THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Một dự án mã nguồn mở — khám phá mã nguồn và tự host từ GitHub.