← سوق الوكلاء
مشروع مفتوح المصدر
AgentBench
بواسطة THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
السيناريو:🔍البحث والاستكشاف
3,495 نجمةاستضافة ذاتية
المهارات
مشروع مفتوح المصدر — استكشف الشيفرة واستضِفه ذاتيًا من GitHub.
بواسطة THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
مشروع مفتوح المصدر — استكشف الشيفرة واستضِفه ذاتيًا من GitHub.