jwigginton/eps-trend-sp500

Name: jwigginton/eps-trend-sp500
Creator: jwigginton
Published: 2024-03-12 06:38:55
License: 暂无描述

Hugging Face2024-03-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/jwigginton/eps-trend-sp500

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与股票或金融相关的数据，主要记录了不同时间点的估计值。数据集中的字段包括股票代码（symbol）、日期（date）、当前季度（current_qtr）、下一季度（next_qtr）、当前年份（current_year）、下一年份（next_year）等，以及这些时间点的当前估计值和过去7天、30天、60天、90天的估计值。数据集分为训练集，包含997个样本，总大小为220508字节。

This dataset is primarily used for stock market analysis, containing stock symbols, dates, and financial estimates for multiple time points in quarters and years. The dataset is divided into a training set with 997 samples, totaling 220508 bytes.

提供机构：

jwigginton

原始信息汇总

数据集概述

特征信息

symbol: 类型为字符串
date: 类型为字符串
current_qtr: 类型为字符串
current_estimate_current_qtr: 类型为浮点数
next_qtr: 类型为字符串
current_estimate_next_qtr: 类型为浮点数
current_year: 类型为整数
current_estimate_current_year: 类型为浮点数
next_year: 类型为整数
current_estimate_next_year: 类型为浮点数
7_days_ago_current_qtr: 类型为浮点数
7_days_ago_next_qtr: 类型为浮点数
7_days_ago_current_year: 类型为浮点数
7_days_ago_next_year: 类型为浮点数
30_days_ago_current_qtr: 类型为浮点数
30_days_ago_next_qtr: 类型为浮点数
30_days_ago_current_year: 类型为浮点数
30_days_ago_next_year: 类型为浮点数
60_days_ago_current_qtr: 类型为浮点数
60_days_ago_next_qtr: 类型为浮点数
60_days_ago_current_year: 类型为浮点数
60_days_ago_next_year: 类型为浮点数
90_days_ago_current_qtr: 类型为浮点数
90_days_ago_next_qtr: 类型为浮点数
90_days_ago_current_year: 类型为浮点数
90_days_ago_next_year: 类型为浮点数

数据分割

train: 包含997个样本，占用220508字节

数据集大小

下载大小: 90843字节
数据集大小: 220508字节

配置信息

config_name: default
data_files:
- split: train
- path: data/train-*

搜集汇总

数据集介绍

构建方式

在金融分析领域，收益预测的时效性与准确性对投资决策至关重要。jwigginton/eps-trend-sp500数据集聚焦于标普500成分股的每股收益（EPS）趋势，通过系统性地采集当前季度、下一季度、当前年度及下一年度的分析师一致预期数据，并整合了回溯至7天、30天、60天及90天前的历史估计值，构建了一个反映预期演变轨迹的时序数据库。每个样本以股票代码（symbol）与日期（date）为索引，包含当前与未来的多期估计值及其历史变化记录，从而捕捉分析师预期在时间维度上的调整动态。

特点

该数据集的核心特色在于其多时间跨度的预期对比能力，不仅提供了当前时刻的EPS估计，还收录了7至90天前的历史估计数据，使得用户能够直观追踪预期修正的方向与幅度。此外，数据集覆盖了从季度到年度的多个预测周期，为短期交易策略与长期价值评估提供了统一的数据基础。所有字段均为数值型或字符串型，结构简洁但信息密度高，特别适用于量化分析中的预期动量研究与市场情绪建模。

使用方法

使用该数据集时，研究者可直接通过HuggingFace的datasets库加载默认配置下的训练分割数据。典型应用场景包括构建EPS预期修正因子、分析分析师一致预期的时序稳定性，或将其作为特征输入到股票收益预测模型中。由于数据以parquet格式存储，用户亦可借助pandas等工具进行自定义预处理，例如按股票代码分组计算预期变化率，或合并其他财务指标以拓展分析维度。数据集规模适中（约997条记录），适合作为研究原型或教学案例的轻量级资源。

背景与挑战

背景概述

在金融量化分析与基本面研究领域，每股收益（EPS）的预测与趋势追踪是评估企业盈利能力及市场预期变化的核心指标。该数据集由研究者jwigginton构建，旨在系统性地捕捉标准普尔500指数成分股的每股收益预期动态。数据集涵盖了从当前季度、下一季度到当前财年及下一财年的分析师一致预期值，并记录了7天、30天、60天及90天前的历史预期数据，为研究预期修正趋势、市场情绪演变以及收益公告前的价格波动提供了结构化数据基础。该数据集的创建填补了公开可获取的高频EPS预期历史记录空白，对于金融时间序列分析、事件驱动策略开发以及实证资产定价研究具有重要支撑作用，尤其适用于检验预期调整与股价反应之间的动态关系。

当前挑战

该数据集所面对的领域挑战首先在于金融预测本身的非平稳性与噪声干扰，EPS预期数据受宏观经济周期、行业政策及公司突发事件影响，存在显著的时间序列结构突变与异常值问题，对模型泛化能力构成严峻考验。其次，数据集仅包含标准普尔500指数成分股，样本数量有限且存在生存偏差，可能无法充分代表中小市值股票的预期行为模式。在构建过程中，数据采集面临多重技术挑战：不同数据源的预期发布时间与定义标准存在差异，需要精确对齐时间戳与会计期间；历史预期数据的回溯计算需处理股票拆分、股息调整及会计准则变更等复杂事件；此外，缺失值的处理、异常预期的识别以及不同预测机构权重差异的校准，均为确保数据质量与一致性的关键难点。

常用场景

经典使用场景

在金融时间序列分析与量化投资研究领域，jwigginton/eps-trend-sp500数据集为探究标准普尔500指数成分股的每股收益（EPS）预期变动趋势提供了核心数据支撑。该数据集收录了多家上市公司在不同时间窗口（7天、30天、60天、90天）内的分析师盈利预测修正信息，涵盖当前季度、下一季度、当前财年及下一财年的预期数值。研究者常利用该数据集构建预测模型，以捕捉市场对盈利预期的动态调整过程，进而分析预期修正与股价波动之间的内在关联，成为行为金融学与市场微观结构研究的重要实证基础。

解决学术问题

该数据集有效解决了学术界在盈利预测修正领域长期面临的数据碎片化与时效性不足的难题。通过提供跨时间维度的标准化预测修订数据，研究者得以系统性地考察分析师预测偏差的演变规律、市场信息传导效率以及预期修正的锚定效应。基于此，学术工作能够深入探讨盈利预测修正对资产定价的冲击机制，检验半强式有效市场假说，并量化分析师群体行为对市场波动率的贡献。这些研究不仅丰富了行为金融学的理论框架，也为后续的预测误差分解与信息溢价研究奠定了坚实的数据基础。

衍生相关工作

该数据集衍生出了一系列具有深远影响力的经典工作。在预测建模方面，研究者基于该数据开发了融合注意力机制的时间序列预测网络，实现了对EPS修正趋势的高精度外推。在因果推断领域，有工作利用该数据构建了双重差分模型，揭示了分析师覆盖范围变化对预测修正速度的因果效应。此外，结合自然语言处理技术，衍生研究将财报电话会议文本情感与预期修正数据对齐，开创了多模态金融预测的新范式。这些工作共同推动了计算金融学与实证资产定价的交叉创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集