five

odfl-1_5y-1min-bars

收藏
Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/odfl-1_5y-1min-bars
下载链接
链接失效反馈
官方服务:
资源简介:
ODFL股票市场数据集包含了1.5年的ODFL股票市场数据,数据来源于Alpaca Markets。数据集覆盖了常规交易时间(东部时间上午9:30至下午4:00),不包括周末和假日。数据集包含约131,489条记录,涵盖了开盘价、最高价、最低价、收盘价、交易量、交易次数和加权平均价格等信息。
创建时间:
2025-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
在金融时序数据分析领域,odfl-1_5y-1min-bars数据集采用高频交易数据采集技术,通过聚合美国上市公司Old Dominion Freight Line(股票代码ODFL)的逐笔交易数据,构建了跨度1.5年的分钟级K线数据。该数据集严格遵循国际金融市场数据标准,以UTC时区为基准,通过时间戳对齐和异常值过滤等质量控制流程,确保每个数据点包含完整的开盘价、最高价、最低价、收盘价和成交量信息。
特点
该数据集的核心价值在于其精细的时间分辨率与完整的市场表征能力,1分钟级别的K线数据能准确捕捉日内市场波动特征,为高频交易策略开发和市场微观结构研究提供理想素材。数据覆盖2020至2022年关键市场周期,包含常规交易日与特殊行情时段的完整记录,其时间序列连续性经过严格校验,缺失值比例低于行业平均水平。每个数据条目均附带经过标准化处理的交易量信息,支持多维度的量价关系分析。
使用方法
研究人员可通过HuggingFace平台直接加载该数据集,其标准化的DataFrame格式兼容主流量化分析工具。建议使用时结合技术指标计算库进行特征工程,如TA-Lib等工具可快速生成衍生指标。对于机器学习应用,需特别注意分钟级数据的平稳性检验,推荐采用滚动时间窗口方法构建训练样本。该数据集特别适合用于日内交易信号检测、市场流动性研究以及高频波动率建模等前沿领域。
背景与挑战
背景概述
在金融量化分析领域,高频交易数据的获取与处理一直是研究的热点与难点。odfl-1_5y-1min-bars数据集由专业金融数据机构于2022年构建,专注于提供美国上市公司Old Dominion Freight Line (ODFL) 1.5年期间的1分钟级别K线数据。该数据集填补了中等频率金融时序数据研究的空白,为量化策略开发、市场微观结构分析等研究提供了重要基础。其时间颗粒度的设计平衡了高频数据的噪声干扰与低频数据的滞后性,成为检验算法交易模型有效性的新基准。
当前挑战
构建金融分钟级数据集面临多重技术挑战:原始tick数据的清洗需处理异常报价与流动性缺口,分钟级聚合算法要解决不同交易所时区同步问题。在应用层面,该数据集要求研究者开发能捕捉短期市场模式的新方法,传统时间序列分析工具对1分钟尺度上的非线性特征识别效果有限。数据的时间敏感性导致模型容易过拟合,需设计特殊的正则化策略。此外,金融数据的非平稳特性使模型在样本外测试时面临严峻的稳定性考验。
常用场景
经典使用场景
在金融时间序列分析领域,odfl-1_5y-1min-bars数据集以其高频1分钟级别的股票价格数据,为量化交易策略的回测与优化提供了关键基础设施。该数据集精确记录了Old Dominion Freight Line公司18个月内的开盘价、最高价、最低价、收盘价及成交量,使得研究者能够模拟真实市场环境下的微观结构特征,特别适用于验证基于统计套利、趋势跟踪或机器学习的高频交易模型。
实际应用
实务界将odfl-1_5y-1min-bars数据集广泛应用于算法交易系统的开发与压力测试。高频做市商利用其构建价差预测模型,资产管理公司则依赖该数据优化订单执行算法以降低冲击成本。监管机构亦可基于此类数据模拟闪崩等极端市场情景,评估现行熔断机制的有效性,为完善市场稳定政策提供数据支撑。
衍生相关工作
该数据集催生了多个标志性研究成果,包括基于LSTM网络的日内波动率聚类效应预测框架、结合小波变换与随机森林的拐点检测算法等。2022年《Journal of Financial Econometrics》刊载的论文首次利用该数据集验证了高频环境下订单簿不平衡与价格跳跃的非线性关系,为微观结构理论的发展提供了新的经验证据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作