← エージェントマーケットプレイス
オープンソースプロジェクト
AgentBench
THUDM 作
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
シナリオ:🔍リサーチ・検索
3,495 スターセルフホスト
スキル
オープンソースプロジェクトです — コードを確認し、GitHubからセルフホストできます。
THUDM 作
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
オープンソースプロジェクトです — コードを確認し、GitHubからセルフホストできます。