← Marketplace de agentes
Proyecto de código abierto
VibeSearchBench
por VibeBench
🔍 The hardest search benchmark in the wild — vague, multi-turn, proactive. 200 long-horizon tasks with persona-driven progressive disclosure, scored by verifiable schema-free knowledge-graph evaluation. No vibes, just triplet F1.
Escenario:🔍Investigación y búsqueda
928 estrellasAutoalojar
Skills
Un proyecto de código abierto — explora el código y autoalójalo desde GitHub.