FinCall-Surprise
收藏arXiv2025-10-05 更新2025-10-08 收录
下载链接:
https://seekingalpha.com/ https://earningscast.com/
下载链接
链接失效反馈官方服务:
资源简介:
FinCall-Surprise是一个大规模、开源、多模态的数据集,专门用于预测公司盈利惊喜。该数据集由2019年至2021年期间2,688个独特的公司电话会议组成,每个会议包含三个同步的模态:逐字逐句的电话会议文本记录、完整的音频录音以及相应的演示文稿。数据集的创建过程包括两个阶段:首先收集大量公开交易的公司,然后从多个来源收集每个公司电话会议的三个不同模态。该数据集旨在解决现有语言模型在金融推理能力方面的关键局限性,并为未来研究建立了一个具有挑战性的新基准。
FinCall-Surprise is a large-scale, open-source, multimodal dataset dedicated to corporate earnings surprise prediction. It consists of 2,688 unique corporate earnings calls spanning the period from 2019 to 2021, with three synchronized modalities per call: verbatim transcripts of the earnings calls, full audio recordings, and corresponding presentation materials. The dataset's development process involves two phases: first, curating a large cohort of publicly traded companies, followed by collecting the three distinct modalities of each company's earnings calls from multiple sources. This dataset aims to address the key limitations of existing language models in financial reasoning capabilities, and establishes a challenging new benchmark for future research.
提供机构:
西北大学, 乔治亚理工学院, 新泽西理工学院
创建时间:
2025-10-05
搜集汇总
数据集介绍

构建方式
在金融预测研究领域,FinCall-Surprise数据集通过严谨的两阶段流程构建而成。首先基于市值与流动性指标筛选美国上市公司,随后从Seeking Alpha平台采集逐字文本转录,从EarningsCast获取完整音频记录,并通过Bloomberg等渠道收集演示文稿。所有模态数据均按季度报告周期进行时间同步,并利用会议标题进行跨源验证,确保多模态数据的时空一致性。
使用方法
针对不同模态的模型评估,该数据集设计了定制化输入策略。文本模态采用基于说话人角色的迭代式摘要方法,在保留核心财务内容前提下控制输入长度;视觉模态通过随机采样演示文稿中间页构建图像输入;音频模态则独立分析声学特征以检验副语言信息价值。所有实验均采用统一提示模板,要求模型在指定格式下输出预测结果与简要推理,确保评估过程的可复现性与可比性。
背景与挑战
背景概述
金融领域中,企业电话会议作为上市公司与分析师、投资者及媒体沟通的核心渠道,其内容对预测每股收益意外具有关键价值。2025年,由西北大学、佐治亚理工学院等机构联合发布的FinCall-Surprise数据集,首次构建了大规模开源多模态基准,涵盖2019至2021年间2,688场企业电话会议的文本转录、音频记录及演示文稿。该数据集旨在突破传统依赖单一文本模态的局限,推动多模态模型在金融预测领域的发展,为量化分析与人工智能交叉研究提供了重要基础设施。
当前挑战
该数据集需解决的核心领域挑战在于准确预测企业每股收益意外,这一任务因市场动态复杂性与信息异构性而极具难度。构建过程中面临三重挑战:其一,多模态数据同步对齐需克服音频、文本及幻灯片在时间维度上的精确匹配问题;其二,真实金融数据中存在类别不平衡现象,正例样本显著多于负例,导致模型评估易产生性能假象;其三,专业金融术语与多模态信号融合对模型语义理解与跨模态推理能力提出极高要求,现有模型尚难以有效整合非文本模态的补充信息。
常用场景
经典使用场景
在金融量化分析领域,FinCall-Surprise数据集通过整合企业电话会议的文本转录、音频记录和演示文稿幻灯片,为盈利意外预测研究提供了多模态分析基础。该数据集支持研究者构建端到端的预测模型,通过解析管理层陈述内容、语音情感特征及视觉辅助材料之间的关联性,模拟专业分析师对企业未来盈利能力的综合研判过程。
解决学术问题
该数据集突破了传统财务预测模型依赖单一文本模态的局限,解决了多模态金融信息融合的技术难题。通过提供同步的文本、音频和视觉数据,显著提升了模型对管理层沟通中隐含信息的捕捉能力,为克服金融数据类别不平衡、模型鲁棒性不足等经典问题提供了实证基础,推动了计算金融与多模态学习的交叉研究进展。
实际应用
在投资决策支持系统中,该数据集可应用于构建智能投研平台,帮助机构投资者自动化分析海量企业电话会议。通过对多维度信息的联合建模,系统能够识别管理层语调变化、幻灯片关键指标与文本陈述的一致性,为量化对冲基金和资产管理公司提供前瞻性的盈利趋势预警,辅助制定更精准的交易策略。
数据集最近研究
最新研究方向
在金融预测领域,FinCall-Surprise数据集的推出标志着多模态学习在盈利意外预测中的前沿探索。该数据集通过融合文本转录、音频记录与演示文稿三模态数据,揭示了当前大语言模型在跨模态金融信号整合中的关键挑战。研究发现,尽管部分模型在准确率指标上表现优异,但受制于真实金融数据的类别不平衡性,其宏观F1分数普遍低于55%,暴露了模型对多数类的预测偏好。封闭源模型展现出更均衡的预测分布,而过度微调的金融专业模型则出现指令遵循能力退化现象。多模态融合虽在特定模型中带来性能提升,但音频与视觉信号的噪声干扰仍制约着预测效力的稳定发挥,为开发具有跨模态推理能力的下一代金融分析模型指明了突破方向。
相关研究论文
- 1FinCall-Surprise: A Large Scale Multi-modal Benchmark for Earning Surprise Prediction西北大学, 乔治亚理工学院, 新泽西理工学院 · 2025年
以上内容由遇见数据集搜集并总结生成



