InfoDeepSeek
收藏InfoDeepSeek 数据集概述
数据集简介
InfoDeepSeek 是一个针对真实网络环境下代理信息搜索任务的基准测试,包含具有挑战性的问题和新颖的评估指标。
数据集特点
- 确定性:问题具有明确且唯一的答案,不受时间影响,便于在动态环境中评估。
- 难度:即使最先进的模型也难以通过单轮搜索成功回答,需要多轮规划和信息检索能力。
- 多样性:涵盖多种问题类型(多跳、长尾、时间敏感、新鲜事件、干扰、错误前提)、领域和主要语言,解决各种现实问题。
数据集内容
- 问题类型:多跳、长尾、时间敏感、新鲜事件、干扰、错误前提。
- 领域:广泛覆盖多个领域。
- 语言:支持多种主要语言。
数据集获取
- 下载地址:https://huggingface.co/datasets/yoga334/InfoDeekSeek
- 本地文件:data/InfoDeepSeek_v1.json
使用指南
环境设置
-
Python版本:>=3.10
-
依赖安装: bash conda create -n InfoSeekAgent python=3.10 conda activate InfoSeekAgent pip install -r requirements.txt
-
浏览器工具:需安装 Chrome 和 Chromedriver。
运行与评估
-
单查询模式: bash sh script/run_toy.sh
-
多查询模式: bash sh script/run_gemini.sh
-
切换搜索引擎:
- 支持 DuckDuckGo、Google、Yahoo、Bing。
- 示例: bash sh script/run_google.sh
引用
bibtex @article{xi2025infodeepseek, title={InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation}, author={Yunjia Xi and Jianghao Lin and Menghui Zhu and Yongzhao Xiao and Zhuoying Ou and Jiaqi Liu and Tong Wan and Bo Chen and Weiwen Liu and Yasheng Wang and Ruiming Tang and Weinan Zhang and Yong Yu}, year={2025}, journal={arXiv preprint arXiv:2505.15872}, url={https://arxiv.org/abs/2505.15872}, }
许可证
- 许可证类型:Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0)
- 许可证链接:https://creativecommons.org/licenses/by-nc/4.0/




