← Marketplace Agen
Proyek open-source
AgentBench
oleh THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Skenario:🔍Riset & Pencarian
3.495 bintangSelf-host
Skill
Proyek open-source — telusuri kodenya dan self-host dari GitHub.
oleh THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Proyek open-source — telusuri kodenya dan self-host dari GitHub.