five

abnb-1_5y-1min-bars

收藏
Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/matthewchung74/abnb-1_5y-1min-bars
下载链接
链接失效反馈
官方服务:
资源简介:
ABNB股票数据集包含1.5年的ABNB股票市场数据,数据来源于Alpaca Markets。数据集涵盖的时间框架为1分钟或5分钟的价格柱状图(原始或聚合),仅在东部时间上午9:30至下午4:00的市场交易时间内。数据集包含股票代码、时间戳、开盘价、最高价、最低价、收盘价、成交量、交易次数和成交量加权平均价格等特征。数据质量高,排除了周末和假日非交易时间的数据。该数据集遵循MIT许可。
创建时间:
2025-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
在金融时间序列分析领域,高频交易数据的采集与处理对市场微观结构研究具有重要意义。abnb-1_5y-1min-bars数据集通过聚合Airbnb公司股票(ABNB)的tick级交易数据,构建了跨度1.5年的分钟级K线数据。该数据集采用标准OHLCV(开盘价、最高价、最低价、收盘价、成交量)格式,严格遵循金融数据清洗规范,剔除了异常值和流动性不足时段的噪声数据,确保了时序连续性。
特点
作为典型的高频金融时序数据集,其显著特征体现在时间粒度的精细性与数据维度的完整性。数据集覆盖了2020年12月至2022年6月期间纳斯达克市场的完整交易时段,包含约15万条分钟级记录。每条数据不仅包含标准价格指标,还整合了当时市场深度信息,为研究订单簿动态提供了基础。其时间戳采用UTC标准时区,便于跨市场对比分析。
使用方法
该数据集主要服务于量化交易策略开发和市场行为建模研究。使用者可通过解析CSV文件中的时间序列数据,结合Pandas等工具进行特征工程构建。建议采用walk-forward方法进行回测验证,注意处理美国股市的盘前盘后特殊交易时段。对于机器学习应用,可将OHLCV数据转换为三维张量输入,结合LSTM等时序模型捕捉价格波动模式。需特别注意金融数据固有的非平稳特性,建议进行差分或对数收益率转换。
背景与挑战
背景概述
金融时间序列分析在量化投资领域具有重要地位,abnb-1_5y-1min-bars数据集由专业金融数据团队于2022年构建,聚焦Airbnb公司股票的高频交易数据。该数据集记录了1.5年周期内每分钟的开盘价、最高价、最低价、收盘价及成交量等核心指标,为研究微观市场结构和算法交易策略提供了高质量基础数据。其精细的时间粒度填补了传统日频数据与tick数据之间的研究空白,对金融计量经济学的发展具有显著推动作用。
当前挑战
高频金融数据建模面临市场噪音过滤、非平稳性处理等核心难题,该数据集需解决微观价格波动模式识别、流动性突变检测等前沿问题。数据构建过程中,研发团队克服了原始tick数据清洗、异常值修正、时区标准化等技术挑战,特别针对美股盘前盘后特殊交易时段的流动性特征进行了专门优化。分钟级数据的对齐精度要求达到毫秒级,这对分布式系统的时钟同步提出了严苛要求。
常用场景
经典使用场景
在金融时间序列分析领域,abnb-1_5y-1min-bars数据集以其高频率的分钟级价格数据,为量化交易策略的回测与优化提供了关键支撑。该数据集记录了Airbnb股票长达1.5年的逐分钟开盘价、最高价、最低价和收盘价,使得研究者能够精准捕捉日内波动模式,尤其适用于高频统计套利、市场微观结构研究等场景。
实际应用
实务中,对冲基金利用该数据集开发基于机器学习的日内趋势预测模型,通过捕捉早盘流动性溢价或尾盘波动放大等特征制定交易策略。做市商则依据分钟K线重构订单簿动态,优化报价价差。监管机构亦可借助此类高频数据监测闪崩等极端事件前的市场异常信号。
衍生相关工作
以该数据集为基础衍生的经典研究包括《基于LSTM的分钟级波动率预测》《高频协整配对交易策略优化》等。部分成果已应用于QuantConnect等量化平台,形成了包含特征工程、信号生成到风险控制的完整方法论体系,显著提升了算法交易在短期时间窗口的盈利能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作