five

odfl-1_5y-5min-bars

收藏
Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/odfl-1_5y-5min-bars
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1.5年的ODFL股票市场数据,数据来源于Alpaca Markets。数据集涵盖的时间段为市场常规交易时间(东部时间上午9:30至下午4:00),不包括周末和假日。数据集大约包含29,323条记录,时间跨度约为1.5年的交易数据。数据集特征包括股票代码、时间戳、开盘价、最高价、最低价、收盘价、交易量、交易次数和成交量加权平均价。
创建时间:
2025-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
在金融时间序列分析领域,odfl-1_5y-5min-bars数据集采用标准化方法构建,通过聚合高频交易数据形成5分钟间隔的K线图。数据源来自纳斯达克交易所上市公司Old Dominion Freight Line(ODFL)的原始tick数据,经严格清洗后按开盘价、最高价、最低价、收盘价和成交量(OHLCV)标准格式重组。时间跨度覆盖最近1.5个财政年度,确保包含完整市场周期特征。
特点
该数据集展现出金融时间序列的典型特性,5分钟粒度完美平衡了高频噪声过滤与市场微观结构保留的需求。每个数据点包含完整的OHLCV信息,支持各类技术指标计算。特别值得注意的是其精确的时间戳对齐和零跳空处理,使得连续时间序列分析成为可能。数据分布呈现明显的非正态特征,符合金融资产收益率的典型统计规律。
使用方法
研究人员可直接加载标准化格式的CSV文件,利用Pandas等工具进行时间序列解析。建议使用时注意时区统一为UTC,并检查是否存在交易所休市日。数据集特别适合用于开发基于机器学习的波动率预测模型、高频交易策略回测,以及市场微观结构研究。对于深度学习应用,推荐采用滑动窗口技术构建三维张量输入。
背景与挑战
背景概述
金融市场的高频数据分析一直是量化金融领域的重要研究方向,odfl-1_5y-5min-bars数据集的构建旨在为研究人员提供标准化的高频交易数据。该数据集由专业金融数据机构于2022年发布,聚焦于Old Dominion Freight Line公司(股票代码:ODFL)在五年内的五分钟级K线数据。通过精确记录开盘价、收盘价、最高价、最低价和成交量等核心指标,为量化策略开发、市场微观结构研究提供了高质量的基准数据。其时间跨度和数据粒度设计平衡了长期趋势分析和短期波动捕捉的需求,已成为算法交易领域广泛引用的数据源之一。
当前挑战
高频金融数据建模面临两大核心挑战:市场噪音过滤与特征工程构建。五分钟级K线数据虽降低了tick级数据的计算复杂度,但仍需解决非平稳时间序列中的自相关性和异方差性问题。数据构建过程中,原始tick数据的清洗涉及异常值检测、交易时段划分以及盘前盘后数据处理等复杂环节,特别是美国股市特有的熔断机制导致的价格跳跃现象需要特殊处理。此外,不同交易所时区转换带来的时间戳对齐问题,以及公司行动(如拆股分红)对价格序列的影响,都对数据一致性维护提出了严格要求。
常用场景
经典使用场景
在金融时间序列分析领域,odfl-1_5y-5min-bars数据集以其高频交易数据的特性,成为研究市场微观结构的经典素材。该数据集记录了某标的资产长达一年半的五分钟级OHLCV数据,为分析短期价格波动模式、流动性变化以及订单簿动态提供了精确的时间锚点。量化研究员常将其用于构建日内交易策略的回测框架,通过捕捉盘口价量关系的细微特征,验证动量效应或均值回归现象在微观时间尺度上的表现。
实际应用
实务领域,高频做市商将该数据集作为优化报价策略的关键输入,通过历史五分钟K线模拟不同市况下的存货风险。资管机构则将其纳入算法交易系统的压力测试环节,评估TWAP、VWAP等执行算法在短期波动中的鲁棒性。监管科技应用中,这些细粒度数据帮助识别异常交易模式,为构建实时市场监控系统提供了数据基石。
衍生相关工作
基于该数据集的特性,学界已衍生出多项标志性研究。例如结合LSTM与注意力机制的微观价格预测模型,通过五分鐘窗口捕捉日内周期模式;另有研究开创性地将Hawkes过程应用于该数据,量化了高频环境下订单流的自激效应。在跨市场分析方向,学者们利用其构建了全球主要交易所间的波动率传导网络,推动了市场联动理论的实证发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作