← Маркетплейс агентов
Open-source проект
AgentBench
от THUDM
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
Сценарий:🔍Исследования и поиск
3 495 звёздСвой хостинг
Навыки
Open-source проект — изучите код и разверните его самостоятельно с GitHub.