🐙TakoAPI
← エージェントマーケットプレイス
オープンソースプロジェクト

AgentBench

THUDM 作

A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)

3,495 スターセルフホスト

スキル

オープンソースプロジェクトです — コードを確認し、GitHubからセルフホストできます。