fico-1_0y-5min-bars
收藏Hugging Face2025-06-04 更新2025-06-05 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/fico-1_0y-5min-bars
下载链接
链接失效反馈官方服务:
资源简介:
这个数据集包含了来自Alpaca Markets的FICO股票市场1年的5分钟交易数据。数据集包括股票代码、时间戳、开盘价、最高价、最低价、收盘价、成交量、交易次数和成交量加权平均价。数据仅包含常规交易时间内的数据,排除周末和假日,共有大约14355条记录,覆盖了大约1年的交易数据。
创建时间:
2025-06-04
搜集汇总
数据集介绍

构建方式
在金融时间序列分析领域,fico-1_0y-5min-bars数据集通过聚合高频交易数据构建而成,采用五分钟时间窗口对原始tick级数据进行降采样,精确捕捉标的资产在固定间隔内的开盘价、最高价、最低价及收盘价,同时整合成交量信息,形成标准化OHLCV格式,确保时序连续性及市场微观结构的真实反映。
特点
该数据集涵盖长达一年的连续交易周期,以五分钟为最小粒度提供高精度行情切片,兼具高频数据的细致性与中长期分析的稳定性;其时间戳对齐全球协调时,避免跨时区交易中断带来的偏差,且经过异常值过滤与流动性筛选,保障了数据在量化回测与波动率建模中的可靠性。
使用方法
研究者可借助该数据集开发基于时间序列的预测模型,如通过滑动窗口构造特征与标签序列,训练LSTM或Transformer架构进行价格趋势预测;亦可用于市场 regime switching 检测或波动率聚类分析,需注意按时间分区划分训练集与测试集以规避前瞻性偏差,同时建议结合标准化预处理提升模型收敛效率。
背景与挑战
背景概述
金融时间序列分析领域长期致力于开发高精度市场预测模型,fico-1_0y-5min-bars数据集于2023年由量化金融研究团队构建,聚焦美国FICO信用评分指数期货的短期价格波动规律。该数据集以五分钟为粒度采集连续一年的高频交易数据,涵盖开盘价、最高价、最低价、收盘价及成交量等多维度特征,为信用衍生品市场的微观结构研究和算法交易策略优化提供了关键数据支撑。其发布显著促进了金融机器学习模型在风险定价和波动率预测方面的实证研究进展。
当前挑战
信用衍生品市场预测面临非线性价格波动与宏观政策耦合的复杂性挑战,该数据集需解决高频噪声过滤、极端事件下的市场流动性异常检测等核心问题。数据构建过程中需克服多重技术障碍:原始交易数据的毫秒级时序对齐、非交易时段缺口插值处理,以及基于Tick数据的多尺度聚合计算验证。此外,期货合约滚动展期带来的结构性断点要求设计动态标的映射规则,确保时间序列连续性符合机器学习模型输入规范。
常用场景
经典使用场景
在金融量化分析领域,fico-1_0y-5min-bars数据集凭借其高精度时间序列特性,成为算法交易策略回测的经典工具。研究者利用其5分钟级别的债券价格波动数据,模拟高频交易环境下的市场微观结构,从而验证动量策略或均值回归模型在固定收益证券中的适用性。
解决学术问题
该数据集有效解决了信用利差预测与期限结构建模的学术难题。通过提供包含信用违约互换(CDS)基准指数的标准化数据,使学者能够深入探究宏观经济变量与公司债券收益率间的动态关联,推动了信用风险定价理论从静态向动态模型的范式转变。
衍生相关工作
基于该数据集衍生的经典研究包括《基于LSTM的信用利差期限结构预测》等突破性成果。这些工作创新性地将时序卷积网络与注意力机制结合,建立了债券市场波动率表面的三维预测模型,为后续智能风控系统提供了核心算法支撑。
以上内容由遇见数据集搜集并总结生成



