← Маркетплейс агентов
Open-source проект
VibeSearchBench
от VibeBench
🔍 The hardest search benchmark in the wild — vague, multi-turn, proactive. 200 long-horizon tasks with persona-driven progressive disclosure, scored by verifiable schema-free knowledge-graph evaluation. No vibes, just triplet F1.
Сценарий:🔍Исследования и поиск
928 звёздСвой хостинг
Навыки
Open-source проект — изучите код и разверните его самостоятельно с GitHub.