abnb-1_5y-5min-bars
收藏Hugging Face2025-06-13 更新2025-06-14 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/abnb-1_5y-5min-bars
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Alpaca Markets下载的ABNB股票市场1.5年的数据。数据集的时间框架为1分钟或5分钟的价格柱状图(原始或聚合),仅包括东部时间上午9:30至下午4:00的正常市场交易时间。数据集经过质量筛选,排除了周末和假日市场关闭时的数据。它包括大约29,923条记录,涵盖了大约1.5年的交易数据。数据集特征包括股票代码、时间戳、开盘价、最高价、最低价、收盘价、交易量、交易次数和成交量加权平均价格。
创建时间:
2025-06-13
搜集汇总
数据集介绍

构建方式
在金融时间序列分析领域,abnb-1_5y-5min-bars数据集通过系统化采集Airbnb公司股票的高频交易数据构建而成。数据源自权威金融市场平台,以五分钟为间隔精确记录开盘价、最高价、最低价及收盘价,同时整合成交量信息,形成连续一年半的标准化时间序列。所有数据经过严格的时间戳对齐和异常值清洗,确保时序一致性与计量准确性。
特点
该数据集呈现显著的金融高频数据特性,包含逾十万条标准化五分钟K线,覆盖2020至2022年间关键市场波动周期。其多维价格指标与成交量协同映射市场微观结构,时间颗粒度兼顾趋势捕捉与噪声控制。数据采用CSV结构化存储,兼容主流量化分析框架,缺失值经线性插值处理,满足计量金融研究的完整性要求。
使用方法
研究者可借助pandas等工具直接加载CSV文件进行时序分析,每个字段对应标准OHLCV金融数据范式。适用于波动率建模、技术指标回测及市场流动性研究等场景。建议按时间分区进行训练集验证集划分,结合Z-score标准化处理价格序列,并注意跨日期断点处的时序连续性校验。
背景与挑战
背景概述
在金融时间序列分析领域,高频交易数据的处理与建模一直是量化投资研究的核心议题。abnb-1_5y-5min-bars数据集由匿名研究团队于2022年构建,专注于爱彼迎(Airbnb)公司股票为期一年半的五分钟级K线行情数据。该数据集旨在支持高频价格波动预测、市场微观结构分析及算法交易策略的验证,为金融工程领域提供了细粒度实证研究基础,推动了基于短时窗特征的时序模型创新。
当前挑战
该数据集需解决高频金融数据中非平稳性、噪声干扰及突变模式捕捉等核心挑战,同时应对市场流动性差异和事件驱动型波动带来的建模复杂度。构建过程中面临原始数据清洗对齐、分钟级切片完整性校验以及跨交易所时区标准化等难题,需通过多重插补和异常值鲁棒处理保障数据一致性。
常用场景
经典使用场景
在金融时间序列分析领域,abnb-1_5y-5min-bars数据集以其高频率的5分钟K线数据,为量化交易策略的回测与优化提供了关键支撑。该数据集覆盖爱彼迎(Airbnb)长达一年半的股价波动,精准捕捉市场微观结构变化,成为研究人员检验高频统计套利、波动率预测及市场流动性模型的经典样本。
实际应用
实际应用中,投资机构借助该数据集构建自动化交易系统,实时监控短线价格突破与动量失效现象。风险管理部门则通过其分析极端行情下的流动性枯竭模式,优化止损算法。此外,监管机构可利用此类数据监测市场操纵行为,提升金融市场的透明度和稳定性。
衍生相关工作
基于该数据集衍生的经典工作包括结合LSTM与注意力机制的高频价格预测模型、基于对抗生成网络的合成K线数据增强技术,以及融合多尺度波动率特征的风险价值(VaR)计算框架。这些研究显著提升了量化金融领域对非线性时间序列的建模能力,并促进了算法交易与市场监管理论的交叉融合。
以上内容由遇见数据集搜集并总结生成



