โ ์์ด์ ํธ ๋ง์ผํ๋ ์ด์ค
์คํ์์ค ํ๋ก์ ํธ
mcpmark
eval-sys ์ ์
MCPMark is a comprehensive, stress-testing MCP benchmark designed to evaluate model and agent capabilities in real-world MCP use.
๋ณ 428๊ฐ์
ํ ํธ์คํ
์คํฌ
์คํ์์ค ํ๋ก์ ํธ์ ๋๋ค โ ์ฝ๋๋ฅผ ์ดํด๋ณด๊ณ GitHub์์ ์ ํ ํธ์คํ ํ์ธ์.