SEC 10-K 报告和季度盈利电话记录的立场检测数据集

Name: SEC 10-K 报告和季度盈利电话记录的立场检测数据集
Creator: 美国证券交易委员会（SEC）
Published: 2025-10-28 00:03:20
License: 暂无描述

arXiv2025-10-28 更新2025-11-04 收录

下载链接：

https://github.com/gnikesh/llm-financial-stance

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由美国证券交易委员会（SEC）的 10-K 年度报告和季度盈利电话记录组成，旨在用于金融领域的立场检测。数据集包含针对三个核心财务指标：债务、每股收益（EPS）和销售额的句子，并使用高级 ChatGPT-o3-pro 模型进行标注。该数据集可用于评估现代大型语言模型（LLM）在金融领域的立场检测能力，旨在解决金融文本分析中难以进行细粒度分析的问题。

This dataset comprises 10-K annual reports and quarterly earnings conference call transcripts from the U.S. Securities and Exchange Commission (SEC), and is designed for financial domain stance detection. It contains sentences focused on three core financial metrics: debt, earnings per share (EPS), and sales, and was annotated using the advanced ChatGPT-o3-pro model. This dataset can be utilized to evaluate the stance detection capabilities of modern large language models (LLMs) in the financial domain, with the goal of addressing the challenge of performing fine-grained analysis in financial text analytics.

提供机构：

美国证券交易委员会（SEC）

创建时间：

2025-10-28

搜集汇总

数据集介绍

构建方式

在金融文本分析领域，该数据集的构建采用了系统化流程。研究团队从美国证券交易委员会的10-K年报和季度盈利电话记录中提取句子，聚焦于债务、每股收益和销售额三个核心财务指标。通过PyPDFLoader工具进行文本分割后，利用LLaMA-3模型进行初步筛选，再借助ChatGPT优化过滤机制以消除误判。最终采用具备深度推理能力的ChatGPT-o3-pro模型进行立场标注，并经过严格的人工验证流程，确保标注质量达到97%以上的人类判断一致性。

特点

该数据集在金融自然语言处理领域展现出鲜明特色。其覆盖SEC报告和盈利电话记录两种差异显著的文本类型，前者以正式严谨的财务叙述为主，后者包含对话式表达。数据标注聚焦句子层级对特定财务目标的立场判断，形成包含积极、消极与中立的三元分类体系。时间跨度上采用2020-2021年作为训练集，2022-2024年作为测试集的分割策略，且选取同行业但市值差异显著的企业样本，增强了数据的代表性和泛化能力。

使用方法

该数据集为金融立场检测研究提供了多维度应用路径。研究者可采用零样本学习直接测试模型的基础推理能力，或通过少样本学习注入特定示例引导模型判断。思维链提示策略能有效提升模型对复杂财务表述的解析深度，而上下文增强机制则允许引入公司管理层讨论与分析章节等背景信息。实验设计支持随机采样与语义相似样本对比，便于探索不同提示策略对债务、每股收益和销售额三类财务目标检测效果的影响。

背景与挑战

背景概述

在金融文本分析领域，SEC 10-K报告和季度盈利电话记录构成了投资者、审计师和监管机构最核心的信息来源。2025年由堪萨斯州立大学、Mathinvestments公司和伊利诺伊大学芝加哥分校联合构建的立场检测数据集，聚焦于债务、每股收益和销售额三大财务指标的细粒度分析。该数据集通过ChatGPT-o3-pro模型在严格人工验证下完成标注，标志着金融自然语言处理从传统情感分析向目标特异性立场检测的重要演进，为量化金融文本理解提供了关键基准。

当前挑战

该数据集面临双重挑战：在领域问题层面，传统金融情感分析方法难以捕捉特定财务目标的立场变化，例如债务增加可能同时蕴含战略机遇与风险信号；在构建过程中，原始文档的复杂句法结构和专业术语导致语义解析困难，而LLaMA-3模型在初始筛选时产生大量误报，需依赖更先进的推理模型进行纠偏。此外，SEC报告的数值密集特性要求模型具备深度量化推理能力，这对当前大语言模型的上下文理解形成持续考验。

常用场景

经典使用场景

在金融文本分析领域，该数据集主要应用于对SEC 10-K年报和季度盈利电话记录中特定财务指标的立场检测。研究人员利用该数据集训练和评估大型语言模型，通过零样本、少样本及思维链提示等策略，精准识别管理层对债务、每股收益和销售额三大核心财务指标所持的积极、消极或中立态度。这种细粒度的立场分析为理解企业财务叙事提供了全新的技术路径。

衍生相关工作

该数据集催生了多项重要的衍生研究。基于其构建的评估框架被广泛应用于比较不同大语言模型在金融立场检测任务中的性能差异，推动了提示工程优化研究。相关工作还深入探讨了语义相似样本选择对少样本学习效果的影响，以及思维链提示在复杂金融推理任务中的增强作用。这些研究共同构成了金融自然语言处理领域的新兴研究方向，为后续工作奠定了方法论基础。

数据集最近研究