five

btcusdt_feb_2026_candles_news_forecast

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://huggingface.co/datasets/tripolskypetr/btcusdt_feb_2026_candles_news_forecast
下载链接
链接失效反馈
官方服务:
资源简介:
BTCUSDT多时间框架GARCH波动率数据集是一个基于回测模拟的加密货币波动率预测数据集。该数据集包含2026年2月期间BTCUSDT交易对的GARCH模型预测波动率数据,时间分辨率为1分钟,共计约40,320条记录。每条记录包含8个不同时间框架(1分钟、5分钟、15分钟、30分钟、1小时、4小时、6小时和8小时)的波动率预测值(sigma)及其可靠性标志。数据以JSONL格式存储,每个条目包含时间戳、交易对信息、各时间框架的波动率预测值及模型可靠性评估。该数据集适用于训练多时间框架波动率预测模型、研究加密货币跨时间框架波动率相关性、评估波动率估计器性能以及为加密货币交易机器学习管道提供特征工程等应用场景。
创建时间:
2026-04-24
原始信息汇总

数据集概述

数据集名称: BTCUSDT Multi-Timeframe GARCH Volatility Dataset
交易对: BTCUSDT
时间周期: 2026年2月(回测模拟)
记录数量: 约40,320条(1分钟分辨率)
语言: 英文
许可协议: MIT


数据集描述

该数据集包含GARCH模型预测的BTCUSDT在8个不同时间框架下的波动率(sigma)的1分钟快照,所有数据均来自回测运行。每条记录通过 reliable 标志指示模型是否有足够的历史K线数据来产生统计上稳定的估计。


数据格式

数据以JSONL格式存储(log.jsonl)。每行是一个JSON对象,结构如下:

json { "id": "uuid-v4", "type": "info", "timestamp": 1769904000000, "createdAt": "2026-02-01T00:00:00.000Z", "methodContext": { "exchangeName": "ccxt-exchange", "strategyName": "feb_2026_strategy", "frameName": "feb_2026_frame" }, "executionContext": { "when": "2026-02-01T00:00:00.000Z", "symbol": "BTCUSDT", "backtest": true }, "topic": "position idle", "args": [{ "symbol": "BTCUSDT", "volatility_1m": { "sigma_1m": 0.00097, "reliable_1m": false }, "volatility_5m": { "sigma_5m": 0.00198, "reliable_5m": true }, "volatility_15m": { "sigma_15m": 0.00403, "reliable_15m": true }, "volatility_30m": { "sigma_30m": 0.00541, "reliable_30m": true }, "volatility_1h": { "sigma_1h": 0.00716, "reliable_1h": true }, "volatility_4h": { "sigma_4h": 0.01698, "reliable_4h": true }, "volatility_6h": { "sigma_6h": 0.01620, "reliable_6h": true }, "volatility_8h": { "sigma_8h": 0.04188, "reliable_8h": true } }] }


字段说明

字段 类型 描述
timestamp 整数 Unix时间戳(毫秒)
createdAt ISO 8601字符串 K线的UTC时间
executionContext.symbol 字符串 交易对(BTCUSDT
executionContext.backtest 布尔值 始终为 true(回测数据)
sigma_Xt 浮点数 GARCH模型预测的下一期波动率(对应时间框架 Xt
reliable_Xt 布尔值 指示GARCH模型是否有足够的历史数据以收敛

时间框架

时间框架 用于拟合的K线数量 典型sigma范围
1分钟 1,500 ~0.001(早期常不可靠)
5分钟 1,500 ~0.002
15分钟 1,000 ~0.004
30分钟 1,000 ~0.005
1小时 500 ~0.007
4小时 500 ~0.017
6小时 300 ~0.016
8小时 300 ~0.042

用途

  • 在多个时间框架上训练波动率预测模型
  • 研究加密货币数据中跨时间框架的GARCH sigma相关性
  • 以GARCH为基准,对波动率估计器进行基准测试
  • 为加密货币交易机器学习流水线进行特征工程

相关配置与文件

配置名称 数据文件路径
volatility_feb_2026(默认) log.jsonl
candles_1m 1m.jsonl
candles_15m 15m.jsonl
candles_30m 30m.jsonl
candles_1h 1h.jsonl
candles_4h 4h.jsonl
candles_8h 8h.jsonl
news news.jsonl
forecast forecast.jsonl
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集依托于backtest-kit与garch工具库,在模拟回测框架下以BTCUSDT交易对为标的构建而成。构建过程中,系统以1分钟为时间分辨率,分别从1分钟至8小时共八个不同时间尺度采集K线数据,并基于GARCH模型预测每个时间尺度下的下一期波动率(sigma)。每条记录均包含一个UUID标识、时间戳、执行上下文以及各时间尺度的sigma值与reliable标志位,后者用于标示GARCH模型是否具备足够的历元K线以确保统计估计的稳健性。数据以JSONL格式存储,支持按时间帧拆分加载。
特点
数据集涵盖1m、5m、15m、30m、1h、4h、6h及8h共八个时间框架的GARCH波动率预测值,每个时间尺度均配备对应的sigma与reliable字段,形成了跨时间尺度的波动率剖面。这种多分辨率设计使得研究者能够同时观察短期与长期波动率的动态变化及其相互关联。值得注意的是,时间尺度越短,模型训练所需历史K线数量越多,但1m尺度在回测初期常因数据不足而出现不可靠标记,体现了模型在经济初始阶段的统计局限性。
使用方法
用户可通过HuggingFace Datasets库加载数据,选择所需的时间帧配置(如'candles_1m'或'candles_15m')以获取对应时间尺度的K线序列,或使用'volatility_feb_2026'默认配置载入完整的波动率日志。数据适用于训练多时间尺度波动率预测模型、分析跨时间框架GARCH sigma相关性、以及作为加密交易机器学习流水线的特征工程输入。研究者在进行波动率估算器基准比较或构建回测信号时,可直接利用sigma与reliable字段,依据reliable标志筛选稳定估计值以提高分析可靠性。
背景与挑战
背景概述
在加密货币市场日益复杂且波动性显著的背景下,准确预测资产价格波动率成为量化交易与风险管理领域的核心挑战。btcusdt_feb_2026_candles_news_forecast数据集由基于backtest-kit与garch工具链构建,旨在模拟2026年2月期间BTCUSDT交易对的GARCH预测波动率场景。该数据集由多个时间尺度的蜡烛图数据、新闻及预测信息构成,覆盖1分钟至8小时共8个频率,每个时间点均包含GARCH模型一步预测的波动率及可靠性标志。其设计初衷是为多时间框架波动率建模、跨频相关性分析及交易策略回测提供标准化基准。该数据集的出现,填补了加密货币领域缺乏公开、标注完整且可复现的多频GARCH基准数据的空白,为量化研究者提供了评估波动率预测模型的新平台,并推动了从单一时间尺度向跨维波动率理解的研究范式转变。
当前挑战
该数据集面临的核心挑战在于:首先,加密货币市场的非平稳性与高频噪声使得GARCH模型在短时间框架(如1分钟)上的估计稳定性不足,数据中reliable标志为false的样本即反映了这一统计困境。其次,多时间框架波动率间的耦合关系复杂,如何从2万至4万条记录中识别出跨尺度波动传递的因果结构,对模型架构提出更高要求。构建过程中,需同时获取并对齐8个时间尺度的历史蜡烛数据,确保各频率下样本量足够(如1分钟需1500根蜡烛),但短周期数据早期阶段常因历史不足而导致估计不可靠。此外,原始信号中时间戳、执行上下文等元数据与波动率张量并存,如何高效解析JSONL格式并处理回测环境中的模拟特性,也是工程实现上的挑战。
常用场景
经典使用场景
在金融时间序列分析领域,波动率预测始终是风险管理和资产定价的核心议题。该数据集封装了比特币永续合约BTCUSDT在2026年2月回测期间,由GARCH模型在八个不同时间粒度(1分钟至8小时)上生成的逐分钟波动率预测值σ,并附带模型可靠性的布尔标记。研究者可直接利用这些多频波动率快照,训练和验证跨时间尺度的波动率预测模型,探究不同频段GARCH预测值之间的统计相关性与领先滞后关系,为加密货币市场的波动率建模提供标准化基准。
衍生相关工作
围绕该数据集已衍生出若干重要研究方向:多频波动率的特征重要性排序与跨时间尺度注意力机制的结合工作,旨在提升极端行情下波动率预测的鲁棒性;基于该数据集的GARCH预测与隐含波动率(如期权定价模型反推值)的对比研究,揭示了加密货币市场中历史波动率与市场预期之间的系统性偏差;此外,还涌现出将多频sigma序列作为强化学习状态空间一部分的工作,驱动仓位管理策略在回测环境中实现更高的夏普比率。
数据集最近研究
最新研究方向
随着加密货币市场波动性的日益加剧,多时间尺度下的波动率建模与预测已成为量化金融领域的前沿热点。该数据集以2026年2月比特币永续合约为标的,整合了从1分钟到8小时共8个时间维度的GARCH预测波动率及可靠性标记,为跨频率波动率传导机制研究提供了高保真回测样本。当前研究方向聚焦于利用多粒度波动率特征提升加密货币风险定价与交易策略的鲁棒性,研究者可借助该数据集探索GARCH模型在极端行情下的适应性、不同时间尺度sigma之间的非线性关联,以及将波动率预测作为特征融入机器学习管线,从而推动加密货币波动率研究从单一时间框架向多维度协同分析演进,对量化投资与金融风险管理具有显著的前沿价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作