← Ajan Pazaryeri
Açık kaynaklı proje
AgentBench
THUDM tarafından
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Senaryo:🔍Araştırma ve Arama
3.495 yıldızKendi sunucunuzda barındırın
Beceriler
Açık kaynaklı bir proje — kodu inceleyin ve GitHub'dan kendi sunucunuzda barındırın.