five

FinReflectKG -MultiHop

收藏
arXiv2025-10-03 更新2025-11-20 收录
下载链接:
https://anonymous.4open.science/r/finreflectkg-multihopqa-BD45/README.md
下载链接
链接失效反馈
官方服务:
资源简介:
FinReflectKG -MultiHop 是一个基于 FinReflectKG 的时间索引金融知识图谱,链接审计三元组到 S&P 100 文件(2022-2024)的源块。通过挖掘跨行业的频繁 2-3 跳子图模式(通过 GICS 税收),我们从 KG 中生成带有确切支持证据的金融分析师风格的问题。两阶段管道首先通过特定模式提示创建 QA 对,然后进行多标准质量控制评估以确保 QA 有效性。

FinReflectKG-MultiHop is a time-indexed financial knowledge graph based on FinReflectKG. It links audited triples to the source blocks of S&P 100 files from 2022 to 2024. By mining frequent 2-3 hop subgraph patterns across industries via GICS taxonomy, we generate financial analyst-style questions with exact supporting evidence from the KG. The two-stage pipeline first creates QA pairs through pattern-specific prompting, then conducts multi-criteria quality control assessments to ensure the validity of the QA pairs.
提供机构:
Domyn
创建时间:
2025-10-03
搜集汇总
数据集介绍
main_image_url
构建方式
在金融知识图谱研究领域,FinReflectKG-MultiHop数据集通过系统化流程构建而成。该数据集基于FinReflectKG知识图谱,从标准普尔100公司2022-2024年度的10-K财报文件中提取审计三元组,并关联原始文档片段。采用两阶段生成流程:首先通过模式特定提示将频繁出现的2-3跳子图模式转化为问答对,随后运用多标准质量控制系统进行筛选,确保问题在金融专业性、多跳推理逻辑和事实准确性方面达到严格标准。构建过程中特别注重跨行业覆盖,通过全球行业分类标准实现不同领域的问题均衡分布。
特点
该数据集在金融问答基准中展现出显著特性。其核心价值在于提供三种对照证据模式:精确的知识图谱路径、基于文本窗口的语义检索模拟、以及包含干扰项的噪声环境模拟,为评估检索策略提供多维视角。数据集涵盖三种推理范围——文档内关系、跨年度关联和跨公司比较,精准模拟了金融分析中的实际工作场景。特别值得注意的是,所有问题均源自真实财报数据构建的知识图谱,每个问答对都附带完整的证据链和来源标注,为可解释性研究提供坚实基础。
使用方法
在金融智能研究应用中,该数据集支持多种实验配置。研究者可对比不同证据模式下的模型表现:知识图谱路径提供精确的结构化证据,文本窗口模式模拟传统向量检索场景,干扰项设置则复现现实检索系统中的噪声挑战。评估体系包含四大指标——基于大语言模型的正确性评分、语义相似度度量、输入令牌效率和输出令牌消耗,全面衡量模型性能。数据集特别适用于探究结构化知识如何提升多跳推理效率,实证研究表明知识图谱引导的检索能使正确率提升约24%,同时降低84.5%的令牌消耗,为高效金融问答系统开发提供关键洞见。
背景与挑战
背景概述
FinReflectKG-MultiHop数据集由Domyn研究团队于2025年推出,专注于金融领域多跳推理问答任务。该数据集基于FinReflectKG知识图谱构建,整合了标准普尔100强企业2022至2024年间的财务披露文件,通过提取跨文档、跨年度及跨公司的多跳关系路径,生成具有精确证据链的金融分析师风格问题。其核心研究目标在于验证知识图谱引导的检索机制对提升大语言模型在复杂金融推理任务中的准确性与效率的效能,为金融智能分析系统提供了结构化评估基准。
当前挑战
金融多跳问答面临证据分散于不同时间、文档与实体间的核心难题,传统检索方法易引入噪声导致模型推理性能下降。构建过程中需攻克多维度挑战:在领域问题层面,需精准捕捉财务指标间动态关联与跨时空依赖关系;在技术实现层面,涉及大规模知识图谱的时序对齐、多跳子图模式挖掘,以及通过质量控制机制确保生成问题的金融语义准确性与推理逻辑严密性。
常用场景
经典使用场景
在金融智能分析领域,FinReflectKG-MultiHop数据集被广泛应用于多跳推理任务的评估与优化。该数据集通过构建基于知识图谱的问答对,模拟金融分析师在SEC文件中检索分散证据的过程,典型场景包括跨文档、跨年份及跨公司的复杂查询。例如,分析ESG投资对财务指标的影响时,模型需要串联不同章节的披露信息,形成连贯的推理链条,从而验证结构化检索在降低噪声干扰方面的优势。
解决学术问题
该数据集主要解决了金融领域多跳推理中证据分散与检索效率低下的核心学术问题。传统方法依赖长上下文窗口,导致语言模型消耗过多计算资源且准确率受限,而FinReflectKG-MultiHop通过知识图谱关联的精确路径,将证据检索与推理解耦,显著提升了答案正确性与语义一致性。其贡献在于建立了首个系统化覆盖时序依赖与监管语义的多跳评估框架,为金融文本理解中的结构化知识融合提供了实证基础。
衍生相关工作
该数据集的发布催生了多项经典衍生研究,例如基于其图谱模式的问答生成框架KG-QAGen,以及针对长文档金融推理的DocFinQA扩展工作。此外,跨领域多跳基准BioHopR借鉴了其分层评估方法,而FinDVer则在可解释声明验证中融合了类似的证据链接机制。这些工作共同推动了结构化知识引导的检索增强生成技术发展,形成了金融自然语言处理与多模态推理交叉研究的重要分支。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作