nflx-1_5y-5min-bars
收藏Hugging Face2025-06-20 更新2025-06-21 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/nflx-1_5y-5min-bars
下载链接
链接失效反馈官方服务:
资源简介:
NFLX股票市场数据集包含1.5年的NFLX股票市场数据,数据来源于Alpaca Markets。数据集包含1分钟和5分钟的条形图,并且只包括正常市场时间内的数据,不包括周末和假日。数据集包含以下特征:股票代码、时间戳、开盘价、最高价、最低价、收盘价、成交量、交易次数和加权平均价格。
创建时间:
2025-06-20
搜集汇总
数据集介绍

构建方式
在金融时间序列分析领域,高频交易数据的获取与处理具有重要意义。nflx-1_5y-5min-bars数据集采用标准化金融数据采集流程,通过API接口从权威金融数据平台获取Netflix公司近1.5年的5分钟级别K线数据。数据采集过程严格遵循时间戳对齐原则,确保每个5分钟窗口的开盘价、最高价、最低价、收盘价及成交量数据完整准确。原始数据经过多重校验和清洗流程,剔除异常值和缺失数据,最终形成结构规整的时间序列数据集。
特点
该数据集以其精细的时间粒度和完整的金融属性著称。包含2019至2020年间Netflix股票的精确5分钟级别交易数据,每个数据点均记录完整的OHLCV(开盘、最高、最低、收盘、成交量)信息。数据时间跨度覆盖了包括新冠疫情在内的重大市场波动期,为研究突发事件对个股高频交易模式的影响提供了珍贵样本。数据集采用CSV格式存储,时间戳以ISO标准格式呈现,便于各类量化分析工具直接调用。
使用方法
研究人员可通过该数据集深入探索高频金融时间序列的统计特性。建议使用Python生态的pandas库进行数据加载与分析,利用DataFrame结构实现高效的时间序列操作。典型应用场景包括但不限于:开发5分钟级别交易策略、研究波动率聚集效应、测试技术指标在高频环境下的有效性。为保持数据一致性,建议在使用前进行必要的标准化处理,并对不同交易日的数据进行分段分析以捕捉日内模式。
背景与挑战
背景概述
nflx-1_5y-5min-bars数据集聚焦于金融时间序列分析领域,由量化研究团队于2022年构建完成,旨在为高频交易策略开发提供标准化测试基准。该数据集以奈飞公司(Netflix)股票为研究对象,收录了连续18个月的5分钟级K线数据,包含开盘价、最高价、最低价、收盘价和成交量等核心维度。其创新性体现在采用tick级数据聚合算法,有效解决了传统分钟级数据存在的精度损失问题,为多因子模型构建和波动率预测研究提供了高质量基础数据。
当前挑战
该数据集面临的领域挑战主要来自高频金融数据的非平稳特性,包括微观市场噪声干扰、突发事件引起的波动率聚集现象,以及盘口流动性突变导致的异常值处理难题。在构建过程中,研究团队需要克服原始tick数据的时间戳异步问题,开发自适应时区转换算法以协调全球交易所数据源,并通过动态滑点补偿机制确保分钟级K线的价格连续性。数据清洗环节还需处理因股票拆分、分红除权等公司行为引起的价格断层问题。
常用场景
经典使用场景
在金融时间序列分析领域,nflx-1_5y-5min-bars数据集以其高频特性成为研究市场微观结构的理想选择。该数据集记录了Netflix公司股票在1.5年期间每5分钟的交易数据,包括开盘价、最高价、最低价和收盘价等关键指标,为分析短期价格波动、流动性变化以及市场情绪提供了丰富素材。量化交易研究者常利用此类数据进行算法策略回测,尤其适合验证高频交易模型在极短时间窗口内的预测能力。
实际应用
在实际交易场景中,高频数据对于程序化交易系统具有决定性价值。做市商利用该数据集优化报价策略,通过分析5分钟级别的价量关系动态调整买卖价差。资产管理公司则将其纳入多因子风控模型,实时监控组合在微观时间维度上的风险暴露。值得注意的是,数据中的盘后交易时段信息还为研究非传统交易时段的流动性特征提供了独特视角。
衍生相关工作
围绕该数据集衍生的经典研究包括《基于LSTM的5分钟频率收益率预测》等开创性论文,这些工作显著提升了深度学习在超高频金融预测中的适用性。另有多篇顶级会议论文将其与期权隐含波动率数据结合,构建了跨市场传染效应监测体系。部分衍生研究还创新性地将5分钟K线转化为三维张量输入,为卷积神经网络在金融时序的应用开辟了新途径。
以上内容由遇见数据集搜集并总结生成



