five

mstr-1_5y-1min-bars

收藏
Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/mstr-1_5y-1min-bars
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集包含了从Alpaca Markets下载的1.5年的MSTR股票市场数据。数据集覆盖了常规市场小时(东部时间上午9:30至下午4:00),不包括周末和假日。数据集以5分钟为一个时间段进行聚合,使用增强的VWAP计算方法。它包含了约142,057条记录,涵盖了大约1.5年的交易数据。数据集的特征包括股票代码、时间戳、开盘价、最高价、最低价、收盘价、成交量、交易次数和加权平均价格。
创建时间:
2025-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
在金融量化分析领域,高频交易数据的采集与处理对策略回测至关重要。mstr-1_5y-1min-bars数据集采用专业级数据管道,通过聚合原始tick级交易数据生成标准化分钟K线,覆盖1.5年连续交易周期。数据清洗过程严格遵循金融数据处理规范,剔除异常报价与流动性不足时段,确保每个1分钟bar包含完整的开盘价、最高价、最低价、收盘价及成交量信息。
使用方法
研究者可通过标准化接口直接载入Pandas DataFrame,时间戳已转换为UTC时区并建立索引。建议使用resample方法进行更高时间维度的重采样,结合成交量过滤可有效避免流动性陷阱。数据集内置的symbol字段支持多标的横向分析,配合TA-Lib等技术指标库可快速构建动量策略回测框架。
背景与挑战
背景概述
mstr-1_5y-1min-bars数据集是金融量化分析领域的重要时间序列数据资源,由专业金融数据机构于2022年构建发布。该数据集聚焦微观市场结构研究,以1分钟为采样频率完整记录了某证券品种连续18个月的逐笔交易数据,包含开盘价、最高价、最低价、收盘价等核心交易指标。其高精度时序特性为市场微观结构理论验证、高频交易策略研发以及金融异常检测提供了关键数据支撑,显著推动了计算金融学与机器学习在量化投资领域的交叉应用。
当前挑战
该数据集需应对金融市场特有的非平稳性挑战,包括日内效应导致的波动聚集性、突发新闻引发的离群值干扰等复杂市场状态。数据构建过程中面临原始交易数据清洗的严峻考验,需处理因系统延迟造成的乱序数据、集合竞价阶段的无效报价等噪声干扰。分钟级颗粒度要求精确对齐交易所时间戳,对时区转换和夏令时调整等时序对齐技术提出极高要求。
常用场景
经典使用场景
在金融时间序列分析领域,mstr-1_5y-1min-bars数据集以其高频率的分钟级K线数据,为量化交易策略的开发和验证提供了坚实基础。研究人员能够基于该数据集精确捕捉市场微观结构特征,测试高频交易算法的执行效果,并分析短期价格波动的统计规律。
解决学术问题
该数据集有效解决了传统日频数据难以刻画市场瞬时行为的学术困境,为研究流动性动态、价格发现机制以及市场效率假说提供了实证基础。其细粒度特性显著提升了波动率预测模型的精度,对市场微观结构理论的完善具有重要推动作用。
实际应用
实务中,高频交易团队利用该数据集进行算法策略的回测优化,做市商据此调整报价策略以控制库存风险。监管机构则通过分析分钟级异常交易模式,增强对市场操纵行为的监测能力,维护金融市场稳定运行。
数据集最近研究
最新研究方向
在金融时间序列分析领域,mstr-1_5y-1min-bars数据集以其高精度的分钟级K线数据,为量化交易策略的优化提供了关键支持。近期研究聚焦于如何利用该数据集捕捉市场微观结构中的非线性特征,结合深度学习模型如Transformer和Temporal Fusion Transformer,提升高频交易信号的预测准确性。随着算法交易在全球市场的普及,该数据集在探索市场流动性、价格发现机制以及极端行情预警等方面展现出独特价值,为金融科技领域的创新研究奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作