open-rl-trading-binance-dataset
收藏Hugging Face2025-08-07 更新2025-08-08 收录
下载链接:
https://huggingface.co/datasets/ResearchRL/open-rl-trading-binance-dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含四个子集的分钟级 Binance Futures 市场数据集,用于训练、验证、测试和回测强化学习代理。数据集支持开发一个能够在高度波动条件下做出盈利交易决策的智能交易系统,并从局部市场脉冲而不是连续流中学习。数据集采用 MIT 许可证发布。
创建时间:
2025-07-25
原始信息汇总
Reinforcement Learning Dataset for Volatility-Driven Futures Trading
项目背景
该数据集用于支持开发智能交易系统的完整强化学习流程,旨在:
- 在高波动性条件下做出有利可图的交易决策;
- 从局部市场脉冲中学习而非连续数据流;
- 在包括滑点和交易费在内的现实条件下运行。
数据集结构
每个数据样本是一个围绕强波动脉冲的150分钟窗口:
- 形状:
(150, 7)— 150分钟 × 7个特征; - 通道:
open,high,low,close,volume,volume_weighted_average,num_trades; - 格式:
.npz封装的np.ndarray; - 元数据:每个会话的唯一键
(TICKER, datetime)。
| 子集 | 样本数 | 时间段 | 用途 |
|---|---|---|---|
Train |
24,104 | 2020-01-14 → 2024-08-31 | 训练 |
Validation |
1,377 | 2024-09-01 → 2024-12-01 | 超参数调优 |
Test |
3,400 | 2024-12-01 → 2025-03-01 | 最终评估 |
Backtest |
3,186 | 2025-03-01 → 2025-06-01 | 真实模拟 |
每个会话包含:
- 90分钟的脉冲前历史(用于状态构建);
- 60分钟的脉冲后交易会话(用于奖励计算)。
数据集动机
该数据集专注于高波动性事件,代表实际市场决策点:
- 10分钟内价格变动超过5%;
- 之前有90分钟的相对稳定期;
- 使用对比率过滤器去除噪声信号。
数据管道工具
预处理逻辑封装在可重用工具中:
load_npz_dataset(path)— 加载会话列表和元数据;select_and_arrange_channels(data, channels)— 过滤和排列输入;calculate_normalization_stats(data)— 计算每通道统计量;apply_normalization(data, stats)— 标准化以供代理使用。
数据处理包括:
- 通道过滤;
- 相对缩放;
- 对数变换;
- NaN/异常值保护。
可视化
每个样本附带可选可视化:
- 带波动脉冲标记的折线图(第90分钟);
- 会话元数据(代码 + UTC时间戳);
- 用于审核信号质量和对齐。
许可证
许可证:MIT License
该数据集在MIT许可证下发布,可自由使用、修改和分发,包括商业用途,但需包含原始版权和许可通知。
下载和使用
可使用HuggingFace的datasets库加载数据集:
python from datasets import load_dataset
示例:加载训练集
train_dataset = load_dataset("ResearchRL/open-rl-trading-binance-dataset", split="train_data")
搜集汇总
数据集介绍

构建方式
在金融量化交易领域,open-rl-trading-binance-dataset采用创新性的脉冲采样方法构建。该数据集精选币安期货交易所分钟级行情数据,通过5%价格波动阈值筛选出150分钟的高波动时段窗口,其中前90分钟为相对稳定期,后60分钟为剧烈波动期。数据经过对比度滤波去噪处理,形成24,104个训练样本和8,963个验证测试样本,覆盖2020至2025年不同市场周期。每个样本包含开盘价、成交量等7维特征,以npz格式封装并附带交易对与时间戳元数据。
特点
该数据集最显著的特征是其面向强化学习的场景化设计。不同于传统连续时间序列,数据聚焦于市场关键决策点,通过150分钟滑动窗口捕捉波动前后的完整状态转移。样本经过标准化、对数变换等预处理,确保特征尺度统一。特别设计的元数据结构支持精确回溯测试,可视化组件可直观呈现波动脉冲标记。数据集严格划分训练、验证、测试和实盘模拟四个子集,符合机器学习全流程验证需求,为交易策略的泛化性评估提供可靠基础。
使用方法
使用者可通过HuggingFace数据集库直接加载npz格式的预处理数据,配套提供的data_utils.py工具包支持通道选择、归一化计算等操作。典型使用流程包括:加载特定分割数据集,调用select_and_arrange_channels筛选特征维度,应用calculate_normalization_stats进行数据标准化。数据集已针对D3QN等强化学习算法优化,建议配合GitHub仓库中的PER经验回放组件使用。每个样本的90/60分钟分段设计天然适配状态构建与奖励计算环节,支持端到端训练与回测评估。
背景与挑战
背景概述
open-rl-trading-binance-dataset数据集由Yuriy Kolesnikov及其团队于2024年发布,旨在为高频波动环境下的期货交易提供强化学习研究支持。该数据集聚焦于币安期货市场的分钟级行情数据,通过精心筛选高波动时段构建训练单元,为开发智能交易系统提供了独特的研究平台。其核心创新在于将传统连续数据采样转变为基于市场决策点的离散事件建模,解决了金融时间序列中信号稀疏性与噪声干扰的关键问题。作为首个面向波动驱动交易的开放数据集,它为量化金融与深度强化学习的交叉研究树立了新范式,相关成果已发表在技术博客与开源社区,推动了算法交易领域的实证研究进展。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,需克服金融市场的非平稳性、交易成本敏感性和高噪声环境对强化学习策略稳定性的影响;在构建过程中,团队必须解决极端事件样本不平衡、多通道时间序列对齐,以及真实交易场景下的滑点模拟等工程难题。特别值得注意的是,如何定义有效的波动触发阈值以平衡信号显著性样本量,以及设计兼顾历史上下文与未来回报的时间窗口,成为数据集质量的关键制约因素。这些挑战直接影响了强化学习代理在实盘环境中的泛化能力,也为后续研究提供了明确的改进方向。
常用场景
经典使用场景
在量化金融领域,该数据集专为强化学习驱动的算法交易系统设计,其最经典的使用场景是训练和验证基于深度强化学习的期货交易策略。数据集聚焦于高波动性时段,通过150分钟窗口捕捉市场脉冲前后的价格动态,为智能体提供具有决策意义的局部市场状态。这种设计使得D3QN等先进算法能够学习在剧烈波动环境中的最优交易时机,而非处理连续平稳的市场数据。
衍生相关工作
围绕该数据集衍生的经典工作包括:基于优先经验回放的D3QN架构优化研究、市场脉冲事件的多模态表征学习,以及交易成本感知的奖励函数设计。GitHub开源项目展示了完整的RL训练流水线,相关研究论文系统比较了不同网络架构在波动性环境中的稳健性,为后续结合Transformer和GNN的时序预测研究提供了基准框架。
数据集最近研究
最新研究方向
在金融科技领域,强化学习算法在高波动性市场环境中的应用正成为研究热点。open-rl-trading-binance-dataset数据集通过精心筛选币安期货分钟级交易数据,聚焦价格波动超过5%的关键决策时刻,为训练智能交易系统提供了高质量样本。该数据集特别适用于研究基于局部市场脉冲而非连续数据流的强化学习模型,如Dueling Double Deep Q-Network (D3QN) 与 Prioritized Experience Replay (PER) 的组合架构。近期研究重点探索如何在此类离散化高波动场景下优化智能体的实时决策能力,同时考虑滑点和交易费用等现实约束。相关成果已应用于实际交易系统,并通过GitHub开源项目与学术论文持续推动算法交易领域的发展。
以上内容由遇见数据集搜集并总结生成



