โ ์์ด์ ํธ ๋ง์ผํ๋ ์ด์ค
์คํ์์ค ํ๋ก์ ํธ
BALROG
balrog-ai ์ ์
Benchmarking Agentic LLM and VLM Reasoning On Games
๋ณ 255๊ฐ์
ํ ํธ์คํ
์คํฌ
์คํ์์ค ํ๋ก์ ํธ์ ๋๋ค โ ์ฝ๋๋ฅผ ์ดํด๋ณด๊ณ GitHub์์ ์ ํ ํธ์คํ ํ์ธ์.