← Ajan Pazaryeri
Açık kaynaklı proje
VibeSearchBench
VibeBench tarafından
🔍 The hardest search benchmark in the wild — vague, multi-turn, proactive. 200 long-horizon tasks with persona-driven progressive disclosure, scored by verifiable schema-free knowledge-graph evaluation. No vibes, just triplet F1.
Senaryo:🔍Araştırma ve Arama
928 yıldızKendi sunucunuzda barındırın
Beceriler
Açık kaynaklı bir proje — kodu inceleyin ve GitHub'dan kendi sunucunuzda barındırın.