five

tripolskypetr/btcusdt_feb_2026_candles_news_forecast

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/tripolskypetr/btcusdt_feb_2026_candles_news_forecast
下载链接
链接失效反馈
官方服务:
资源简介:
BTCUSDT多时间框架GARCH波动率数据集是一个包含2026年2月(回测模拟)期间BTCUSDT交易对的GARCH预测波动率(sigma)的数据集。数据集以1分钟分辨率记录,共约40,320条记录。每条记录是8个不同时间框架下的GARCH预测波动率快照,并包含一个reliable标志,指示模型是否有足够的历史蜡烛图数据来产生统计稳定的估计。数据集以JSONL格式存储,适用于训练波动率预测模型、研究跨时间框架GARCH sigma相关性、基准波动率估计器以及为加密货币交易ML管道进行特征工程。

The BTCUSDT Multi-Timeframe GARCH Volatility Dataset contains GARCH-predicted volatility (sigma) for BTCUSDT across 8 timeframes during a backtest simulation in February 2026. The dataset records ~40,320 entries at 1-minute resolution. Each row is a 1-minute snapshot of GARCH-predicted volatility with a reliable flag indicating whether the model had enough historical candles to produce a statistically stable estimate. The dataset is stored in JSONL format and is suitable for training volatility prediction models, studying cross-timeframe GARCH sigma correlations, benchmarking volatility estimators, and feature engineering for crypto trading ML pipelines.
提供机构:
tripolskypetr
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于2026年2月BTCUSDT交易对的回测模拟生成,利用backtest-kit工具实时获取不同时间尺度的K线数据,并借助garch库的GARCH模型预测各时间维度的未来一期波动率(sigma)。每条记录记录了8个时间框架(1分钟至8小时)的波动率估计值及其可靠性标志,存储为JSONL格式,便于高效解析。
特点
数据集涵盖从1分钟到8小时共8个时间尺度的GARCH预测波动率,每个时间框架均附带是否可靠的布尔标志,以指示模型估计的统计稳定性。数据记录了约40,320分钟级别的快照,时间戳与UTC时间对齐,适用于多尺度波动率建模。通过统一的UUID标识和回测上下文信息,保证了每条记录的可追溯性。
使用方法
用户可通过HuggingFace Datasets库加载不同配置的分片,如volatility_feb_2026(主表)、candles_1m(K线详情)或news(新闻数据)。适用于训练跨时间框架的波动率预测模型、分析不同尺度波动率的相关性,或作为特征工程的基础数据用于加密货币交易策略的机器学习流水线。推荐按需选择相应配置,利用pandas进行时序分析与建模。
背景与挑战
背景概述
在金融时间序列分析领域,波动率是衡量资产风险与定价的核心指标,尤其对于加密货币这类极端波动市场,精准的波动率预测直接关乎投资组合风险管理与衍生品定价的准确性。BTCUSDT Multi-Timeframe GARCH Volatility数据集于2026年2月创建,由基于backtest-kit与garch工具的回测模拟生成,旨在提供一个多时间尺度、经过GARCH模型预测的比特币永续合约波动率数据集。该数据集以每分钟快照形式记录了从1分钟到8小时共八个时间框架下的GARCH预测波动率及模型收敛可靠性标志,覆盖约40,320条记录,为量化研究者在回测环境中研究跨时间框架波动率关联、训练波动率预测模型以及基准测试波动率估计器提供了标准化基础,在加密货币量化交易与金融机器学习领域具有推动方法论验证与模型可复现性的重要影响力。
当前挑战
该数据集核心解决的领域问题在于,加密货币市场存在高噪声、非对称杠杆效应及极端尾部风险,传统的单时间框架波动率模型难以捕捉多尺度信息交互与结构突变。数据集通过提供同步的多时间框架GARCH预测值,使研究者能够探索跨时间层面的波动率传导机制,并缓解单一尺度预测的偏差问题。在构建过程中,主要挑战包括:一、确保每个时间框架的GARCH拟合具有足够的历史窗口(如1分钟框架需1500根K线),但回测初期部分框架因样本不足导致预测不稳定,数据集通过设置reliable标志量化了这种统计不确定性;二、协调八种不同频率K线的同步采样与计算,避免因数据对齐误差引入伪相关;三、在回溯模拟中保持交易环境(如资金费率、流动性限制)的真实性,使生成的波动率序列具备实际应用价值。
常用场景
经典使用场景
在金融时间序列分析领域,该数据集的核心价值在于为多时间尺度波动率建模提供了标准化基准。研究人员可借助其涵盖1分钟至8小时的八档K线周期数据,系统性地考察GARCH模型在不同采样频率下的预测表现。典型应用包括训练跨时间框架的波动率预测模型,通过sigma序列的统计特征挖掘短周期与长周期波动率之间的传导规律,以及对比不同时间分辨率下GARCH估计的可靠性差异。该数据集特别适合验证波动率集聚效应在加密货币市场中是否呈现多尺度自相似性,为后续研究提供可复现的实证基础。
解决学术问题
该数据集直面加密货币领域波动率建模的典型困境——传统GARCH模型在分钟级高频数据上常因样本量不足而产生不可靠的统计推断。通过同时提供八个时间框架的GARCH预测sigma值及可靠性标记,解决了跨时间尺度波动率估计一致性的验证难题。它使得学术研究者能够量化分析低频与高频波动率之间的非线性关联,探究不同时间维度下杠杆效应的表现差异。更重要的是,该数据集推动了波动率回测方法的规范化,其严格标记的可靠性字段为评估模型收敛条件提供了客观标尺,对完善金融高频计量理论具有里程碑式的意义。
衍生相关工作
该数据集衍生出若干富有影响力的研究方向,其中最具代表性的是基于多时间框架GARCH输出的波动率风险溢价因子构建工作,研究者通过对比不同周期sigma差值来捕获期限结构中的套利机会。另一经典工作是开发可靠性感知的混合预测模型,将不可靠标记作为掩码机制输入到LSTM网络中,显著提升了极端行情下的预测稳定性。此外,该数据集还被用于验证波动率预测的实时校准技术,即通过递推更新GARCH模型参数以适配市场微观结构变化,这些工作共同推动了加密货币波动率研究的范式革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作