FinSearchComp
收藏FinSearchComp 数据集概述
数据集基本信息
- 数据集名称:FinSearchComp
- 全称:FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning
- 项目地址:https://github.com/randomtutu/FinSearchComp
- Hugging Face地址:https://huggingface.co/datasets/ByteSeedXpert/FinSearchComp
- 论文地址:https://arxiv.org/abs/2509.13160
- 许可证:CC-BY-4.0
数据集描述
FinSearchComp是一个用于金融搜索和推理评估的基础性端到端评估基础设施,包含一个开放的金融基准测试。该数据集旨在直接衡量现实决策任务中的三个核心技能:
- 寻找正确信号的能力
- 检查和协调信息来源的能力
- 在时间压力下基于信息做出有根据判断的能力
数据集特点
- 包含时间敏感获取任务
- 包含历史查找任务
- 包含多源调查任务
- 提供专家级别的金融搜索和推理评估
项目结构
核心模块
- eval:评估模块,包含主要评估脚本eval.py
- chat:对话处理模块,包含chat.py用于处理完整数据集
- data:数据存储模块,包含JSON格式的FinSearchComp数据文件
- config:配置模块,包含API密钥和模型设置
- result:结果存储模块,包含对话输出和评估结果
- models:模型实现模块,支持DeepSeek、OpenAI和Gemini模型
- logger:日志配置模块
快速开始
环境配置
bash git clone git@github.com:randomtutu/FinSearchComp.git cd FinSearchComp conda create -n finsearchcomp python=3.10 conda activate finsearchcomp pip install -r finsearchcomp/requirements.txt
数据处理流程
-
配置API密钥至finsearchcomp/config/config.yaml
-
处理数据文件: bash python finsearchcomp/chat/chat.py --model_name gemini-2.5-flash --input_file ../data/finsearchcomp_data.json --output_path result/chat-result/chat.json --limit 1
-
执行评估: bash python finsearchcomp/eval/eval.py --model_name gemini-2.5-flash --input finsearchcomp/result/chat-result/chat.json --output finsearchcomp/result/eval-result/eval.json
开发机构
- ByteDance Seed
- Columbia Business School
引用信息
bibtex @misc{hu2025finsearchcomprealisticexpertlevelevaluation, title={FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning}, author={Liang Hu and Jianpeng Jiao and Jiashuo Liu and Yanle Ren and Zhoufutu Wen and Kaiyuan Zhang and Xuanliang Zhang and Xiang Gao and Tianci He and Fei Hu and Yali Liao and Zaiyuan Wang and Chenghao Yang and Qianyu Yang and Mingren Yin and Zhiyuan Zeng and Ge Zhang and Xinyi Zhang and Xiying Zhao and Zhenwei Zhu and Hongseok Namkoong and Wenhao Huang and Yuwen Tang}, year={2025}, eprint={2509.13160}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2509.13160}, }




