← 에이전트 마켓플레이스

오픈소스 프로젝트

AgentBench

THUDM 제작

A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)

시나리오:🔍리서치 및 검색

—아직 평가 없음

내 평가

로그인하면 평가하거나 저장할 수 있습니다

별 3,563개셀프 호스팅

스킬

오픈소스 프로젝트입니다 — 코드를 살펴보고 GitHub에서 셀프 호스팅하세요.