five

mnst-1_5y-1min-bars

收藏
Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/mnst-1_5y-1min-bars
下载链接
链接失效反馈
官方服务:
资源简介:
MNST股票数据集包含从Alpaca Markets下载的1.5年的MNST股票市场数据。数据集涵盖了常规交易时间(东部时间上午9:30至下午4:00)内的1分钟或5分钟的价格条形图。数据集排除了周末和假日,大约有144,803条记录,覆盖了大约1.5年的交易数据。数据集特征包括股票代码、时间戳、开盘价、最高价、最低价、收盘价、交易量、交易次数和成交量加权平均价。
创建时间:
2025-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
在金融时间序列分析领域,高频交易数据的采集与处理对市场微观结构研究具有重要意义。mnst-1_5y-1min-bars数据集采用标准化方法构建,通过聚合原始tick级交易数据形成分钟级K线,严格遵循开盘价、最高价、最低价、收盘价(OHLC)的计算规范,并同步记录成交量信息。数据清洗过程包含异常值检测与修正机制,确保时间序列的连续性和完整性。
特点
该数据集覆盖1.5年跨度的分钟级金融时序数据,具有典型的高频数据特征。每个数据点包含多维市场信息,时间戳精度达到毫秒级,支持精细化的市场行为分析。数据存储采用列式压缩格式,在保持原始信息量的同时显著提升IO效率。时间序列严格对齐交易所官方时间轴,避免因采样偏差导致的分析误差。
使用方法
研究人员可通过标准化接口加载数据集,直接对接主流量化分析框架。数据采用pandas.DataFrame兼容格式存储,支持时间序列重采样、技术指标计算等常见操作。针对机器学习应用场景,提供滑动窗口生成工具,便于构建监督学习样本。使用前建议进行数据标准化处理,并注意不同交易时段的市场微观结构差异。
背景与挑战
背景概述
金融时间序列分析在量化投资领域具有重要地位,高频交易数据的处理尤为关键。mnst-1_5y-1min-bars数据集由专业金融数据团队于2020年构建,聚焦于分钟级K线数据的标准化处理。该数据集收录了1.5年周期内多支标的资产的1分钟粒度交易数据,为量化策略开发、市场微观结构研究提供了高质量的基础数据。其创新性在于实现了原始tick数据到标准OHLCV格式的精准转换,填补了中高频数据领域的空白。
当前挑战
金融高频数据建模面临两大核心挑战:数据质量层面,原始tick数据存在异常值、缺失值等问题,需开发鲁棒的清洗算法确保分钟级聚合的准确性;特征工程层面,如何从有限维度OHLCV数据中提取有效市场特征,克服传统技术指标的滞后性缺陷。数据集构建过程中,时区转换、节假日处理等时序对齐问题,以及不同交易所数据格式的异构性,都对数据标准化提出了严峻考验。
常用场景
经典使用场景
在金融时间序列分析领域,mnst-1_5y-1min-bars数据集以其高频分钟级价格数据为特征,成为量化交易策略回测的黄金标准。该数据集完整记录了标普500指数成分股在1.5年周期内的开盘价、最高价、最低价和收盘价,为研究人员构建动量策略、均值回归策略提供了精确的微观结构数据基础。其时间颗粒度恰能捕捉日内交易模式,又不至于引入高频噪声,在平衡数据密度与计算效率方面展现出独特优势。
衍生相关工作
以该数据集为基础衍生的经典研究包括《基于LSTM的分钟级波动率预测》等神经网络应用论文,开创了深度学习在日内交易信号挖掘的先河。著名开源项目Alphalens将其作为多因子回测的标准测试集,推动了量化因子库的标准化建设。CME集团近期发布的ES微期货合约设计,亦大量引用基于该数据集的流动性研究成果。
数据集最近研究
最新研究方向
在金融时间序列分析领域,mnst-1_5y-1min-bars数据集以其高频分钟级行情数据的特性,正成为量化交易策略优化的关键资源。近期研究聚焦于结合深度学习的时序预测模型,探索LSTM与Transformer架构在捕捉市场微观结构特征上的表现差异。该数据集为验证高频统计套利策略提供了理想实验环境,特别是在加密货币市场波动加剧的背景下,研究者正尝试建立更鲁棒的波动率预测框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作