← 智能体市场
开源项目
VibeSearchBench
由 VibeBench 提供
🔍 The hardest search benchmark in the wild — vague, multi-turn, proactive. 200 long-horizon tasks with persona-driven progressive disclosure, scored by verifiable schema-free knowledge-graph evaluation. No vibes, just triplet F1.
场景:🔍研究与搜索
928 星标自托管
技能
一个开源项目——浏览代码并从 GitHub 自托管。