Agentar-DeepFinance-100K

github2025-07-27 更新2025-07-29 收录

下载链接：

https://github.com/antgroup/Agentar-DeepFinance-100K

下载链接

链接失效反馈

官方服务：

资源简介：

Agentar-DeepFinance-100K是一个高质量的大规模金融推理数据集，通过深度优化数据合成与验证逻辑，致力于推动金融推理领域的技术探索。数据集包含金融分析与解读、金融数学、金融合规与安全等核心任务模块，为训练支持金融业务全流程的智能体提供了扎实基础。

Agentar-DeepFinance-100K is a high-quality large-scale financial reasoning dataset. Developed with deeply optimized data synthesis and validation logic, it is dedicated to advancing technical exploration in the field of financial reasoning. The dataset covers core task modules including financial analysis and interpretation, financial mathematics, financial compliance and security, providing a solid foundation for training AI Agents that support the end-to-end financial business workflow.

创建时间：

2025-07-24

原始信息汇总

Agentar-DeepFinance-100K 数据集概述

数据集简介

名称: Agentar-DeepFinance-100K
类型: 大规模金融行业深度CoT（Chain of Thought）数据集
规模: 100K
许可证: Apache 2.0
技术报告: arXiv:2507.12901
数据地址: Hugging Face

核心特点

1. 深度CoT知识扩增

采用多视角反事实知识提取（MKE）技术
覆盖多种金融场景需求
生成多样化且深入的金融推理链

2. 深层CoT知识抽取

分析CoT必要性、思维链长度适配性等关键要素
提供高质量CoT评估框架
形成可复用的指导性规则

3. 深融CoT人机协同验证

结合人类专家验证与自反思重写（SCR）技术
提升CoT数据合成成功率与推理精度

行业价值

深度与精准并重: 提升复杂金融场景下的推理和决策能力
真实场景驱动: 由领域专家严格标注与校准
方法论通用性: 提供高质量CoT评估框架
全链路智能体培育: 覆盖金融分析与解读、金融数学、金融合规与安全等核心任务

适用对象

金融智能体研发团队
金融机构技术团队
学术研究者

实验成果

1. CoT必要性实验

加入CoT显著提升模型性能，特别是在复杂推理任务中

2. CoT合成器实验

推理模型作为CoT合成器的有效性与其内在推理性能不完全一致
蒸馏QwQ-Plus获得的CoT质量超过蒸馏DeepSeek-R1

3. CoT长度实验

金融推理模型需要长CoT

数据来源

公开数据集: FinCorpus, Finance-Instruct-500K, FinCUGE, FinQA等
数据标注: 由长沙数字天蚂信息技术有限公司和数字天蚂（重庆）信息技术有限公司提供

数据安全

遵循金融数据安全与隐私合规要求
开源版本已进行去污去毒处理

引用

bibtex @misc{zhao2025deepfinance, title={Agentar-DeepFinance-100K: A Large-Scale Financial Dataset via Systematic Chain-of-Thought Synthesis Optimization}, author={Xiaoke Zhao and Zhaowen Zhou and Lin Chen and Lihong Wang and Zhiyi Huang and Kaiyuan Zheng and Yanjun Zheng and Xiyang Du and Longfei Liao and Jiawei Liu and Xiang Qi and Bo Zhang and Peng Zhang and Wei Wang and Zhe Li}, year={2025}, eprint={2507.12901}, archivePrefix={arXiv}, primaryClass={cs.CE}, url={https://arxiv.org/abs/2507.12901}, }

联系方式

官方邮箱: [yanchang.zxk@antgroup.com]

搜集汇总

数据集介绍

构建方式

在金融智能化领域，高质量的推理链数据对模型性能至关重要。Agentar-DeepFinance-100K通过多视角反事实知识提取技术（MKE）系统化构建，从问题、思考过程和回答三个层次生成深度金融推理链。结合人类专家验证与自反思重写技术（SCR），对合成失败的难例进行精准校验，确保数据的高质量和推理深度。这一构建流程不仅覆盖多样化金融场景，还显著提升了数据的合成成功率和推理精度。

特点

Agentar-DeepFinance-100K以其深度与精准并重的CoT数据能力脱颖而出。数据集通过领域专家严格标注与校准，内容高度贴合实际金融业务场景，有效降低了智能体部署的场景适配成本。其模块化设计覆盖金融分析、数学计算、合规与安全等核心任务，为全链路金融智能体的能力培育提供了扎实基础。此外，数据集还提供了可复用的高质量CoT评估框架，为行业技术标准化发展提供了方法论支持。

使用方法

该数据集适用于金融智能体研发、金融机构技术团队及学术研究者。用户可通过Hugging Face平台获取数据，用于训练和验证金融领域推理模型。对于复杂金融场景中的推理能力优化，建议结合数据集中提供的长CoT样本进行模型微调。同时，可利用其标准化评估框架对自主扩展的业务场景数据进行质量验证，实现技术自主优化。数据集已进行去污去毒处理，符合金融数据安全与隐私合规要求。

背景与挑战

背景概述

Agentar-DeepFinance-100K数据集由蚂蚁集团等机构于2025年推出，旨在解决金融领域推理模型面临的高质量思维链数据稀缺问题。该数据集通过多视角反事实知识提取技术和人机协同验证机制，构建了覆盖金融分析、数学计算、合规安全等核心场景的10万条深度推理链。作为金融智能化领域的重要基础设施，它不仅填补了专业领域CoT数据集的空白，更通过系统化的合成优化方案，为金融大语言模型的深度推理能力培养提供了关键支撑。

当前挑战

金融领域推理链构建面临双重挑战：在领域问题层面，需克服金融文本特有的专业术语密集、计算逻辑复杂、合规要求严格等特性，这对思维链的准确性和完备性提出极高要求；在数据构建层面，如何平衡反事实扩增带来的多样性提升与专家验证产生的高成本之间的矛盾，以及设计适配金融场景的CoT长度评估标准，成为确保数据集质量的关键难题。

常用场景

经典使用场景

在金融智能化领域，Agentar-DeepFinance-100K数据集凭借其深度优化的推理链（CoT）合成技术，成为训练金融大语言模型的核心资源。该数据集通过多视角反事实知识提取和人机协同验证，构建了覆盖金融分析、合规审查、量化计算等复杂场景的思维轨迹，特别适用于需要高阶金融推理能力的任务，如衍生品定价模型优化或风险价值（VaR）计算。其模块化的设计允许研究者针对信贷评估、反洗钱监测等细分场景进行定向微调。

解决学术问题

该数据集系统性地解决了金融自然语言处理中三个关键难题：复杂金融语义的深度解析、多步骤推理的逻辑连贯性保障，以及专业领域知识与通用语言模型的融合瓶颈。通过引入反事实扩增策略和自反思重写技术，显著提升了模型在隐含前提识别、动态市场因素关联等薄弱环节的表现，为构建可解释的金融决策模型提供了数据基础。其发布的评估框架更成为学界衡量金融推理质量的新标准，推动了领域内方法论的标准化进程。

衍生相关工作

基于该数据集衍生的Agentar-Fin-R1模型在Finova等基准测试中刷新性能记录，其提出的多阶段知识蒸馏架构已成为金融大模型训练的参考范式。蚂蚁数科团队进一步扩展出FinCAS安全合规数据集，推动了金融文本毒性检测技术的发展。相关研究提出的'CoT Cube'评估体系更被后续工作如FinEval 2.0等广泛采用，形成了金融推理能力评测的方法论传承。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集