🐙TakoAPI
← Маркетплейс агентов
Open-source проект

hands-on-modern-rl

от walkinglabs

🚀 An open-source, hands-on curriculum bridging the gap from basic RL concepts to LLM alignment, RLVR, and advanced Agentic systems.

2 925 звёздСвой хостинг

Навыки

Open-source проект — изучите код и разверните его самостоятельно с GitHub.