five

binance-futures-ohlcv-2018-2026

收藏
Hugging Face2026-01-11 更新2026-01-12 收录
下载链接:
https://huggingface.co/datasets/123olp/binance-futures-ohlcv-2018-2026
下载链接
链接失效反馈
官方服务:
资源简介:
币安期货Main4数据集是一个精简版的币安期货历史数据,包含BTC、ETH、BNB和SOL四个主要加密货币的1分钟K线数据和期货指标数据。数据集时间跨度为6年,记录数达到1150万条,压缩后大小为415MB。数据以PostgreSQL COPY Binary + Zstandard压缩格式存储,适用于TimescaleDB。该数据集适用于量化回测、机器学习、技术分析、市场研究和情绪分析等多种应用场景。
创建时间:
2026-01-03
原始信息汇总

数据集概述

基本信息

  • 数据集名称: 币安期货 Main4 数据集 (BTC/ETH/BNB/SOL)
  • 描述: 精简版币安期货历史数据,只包含4个主要币种,适合快速下载和研究使用。
  • 许可证: MIT License
  • 任务类别: 时间序列预测
  • 语言: 英文、中文
  • 标签: 加密货币、比特币、以太坊、交易、币安、OHLCV、期货、时间序列、量化金融
  • 数据规模: 10M < n < 100M
  • 记录总数: 1150万条
  • 压缩后大小: 约415MB
  • 时间跨度: 6年

数据内容与结构

文件构成

文件 记录数 压缩大小 时间范围 说明
candles_1m_main4_*.bin.zst 998万 366 MB 2020-01 ~ 2026-01 1分钟K线 (Binary)
futures_metrics_main4_*.bin.zst 152万 49 MB 2021-12 ~ 2026-01 期货指标 (Binary)
schema_*.sql.zst - 6.3 KB - TimescaleDB Schema

包含币种详情

币种 K线记录数 K线时间范围 期货指标记录数 完整度
BTCUSDT 317万 2020-01-01 ~ 2026-01-11 43万 100%
ETHUSDT 317万 2020-01-01 ~ 2026-01-11 24万 100%
BNBUSDT 311万 2020-02-10 ~ 2026-01-11 43万 100%
SOLUSDT 53万 2025-01-01 ~ 2026-01-04 43万 99.99%

数据字段定义

📈 candles_1m (1分钟K线)

字段 类型 说明 示例
exchange string 交易所 binance_futures_um
symbol string 交易对 BTCUSDT
bucket_ts timestamp K线时间 (UTC) 2024-01-01 00:00:00
open decimal 开盘价 42150.50
high decimal 最高价 42180.00
low decimal 最低价 42100.00
close decimal 收盘价 42165.30
volume decimal 成交量 (币) 125.5
quote_volume decimal 成交额 (USDT) 5289150.25
trade_count int 成交笔数 3521
taker_buy_volume decimal 主动买入量 68.2
taker_buy_quote_volume decimal 主动买入额 2875420.10

📊 futures_metrics_5m (期货指标)

字段 类型 说明 用途
create_time timestamp 时间戳 (UTC) 数据时间
symbol string 交易对 币种标识
sum_open_interest decimal 持仓量 (张) 市场参与度
sum_open_interest_value decimal 持仓价值 (USDT) 资金规模
sum_toptrader_long_short_ratio decimal 大户多空比 主力方向
sum_taker_long_short_vol_ratio decimal 主动买卖比 即时情绪
count_long_short_ratio decimal 散户多空比 散户情绪

使用信息

数据格式与恢复

  • 数据格式: 使用 PostgreSQL COPY Binary + Zstandard 格式压缩,需导入 TimescaleDB 使用。
  • 恢复方法: 提供了通过命令行或恢复脚本将数据恢复到 TimescaleDB 的具体步骤。

应用场景

场景 说明
🤖 量化回测 策略历史验证,分钟级精度
🧠 机器学习 价格预测、趋势分类、异常检测
📊 技术分析 计算各类技术指标 (MA/RSI/MACD等)
💹 市场研究 波动率分析、相关性分析
📉 情绪分析 多空比、持仓量变化分析

数据来源与属性

  • 交易所: Binance Futures (USDT-M 永续合约)
  • 采集方式: WebSocket 实时推送 + REST API 历史回填
  • 数据延迟: < 5 秒
  • 导出时间: 2026-01-11

其他信息

  • 完整版数据集: 如需全部 615+ 币种的完整数据,可访问 Kaggle: https://www.kaggle.com/datasets/tukuaiai/binance-crypto-ohlcv-futures
  • 免责声明: 数据集仅供教育和研究目的,不构成投资建议。加密货币交易存在重大风险,使用前请自行验证数据准确性。
搜集汇总
数据集介绍
main_image_url
构建方式
在数字货币量化分析领域,高质量的历史价格数据是模型训练与策略回测的基石。本数据集通过整合币安期货交易所的实时推送与历史回填机制,系统性地采集了BTC、ETH、BNB和SOL四种主要加密货币永续合约的分钟级OHLCV数据及期货市场指标。数据采集过程确保了低于五秒的延迟,并经过完整性校验,最终以PostgreSQL二进制格式结合Zstandard高效压缩技术进行封装,便于在TimescaleDB时序数据库中直接恢复与查询。
使用方法
为充分发挥该数据集在量化金融与机器学习研究中的价值,其使用流程围绕时序数据库展开。用户需首先将压缩的二进制数据流导入至部署好的TimescaleDB实例中,恢复预设的数据表结构。随后,研究者可利用标准SQL语句或内置的时间桶聚合函数,灵活地进行数据提取、跨周期转换以及复杂指标计算。这种设计使得从基础的技术分析到高级的机器学习特征工程,均能在一个统一且高效的数据平台上完成。
背景与挑战
背景概述
在数字货币交易领域,高频时间序列数据是量化金融与算法交易研究的基石。币安期货Main4数据集由独立数据贡献者于2026年发布,聚焦于币安交易所USDT永续合约市场中四个核心币种——BTC、ETH、BNB与SOL。该数据集涵盖了自2020年至2026年的分钟级OHLCV数据及期货市场指标,旨在为加密货币市场的高频价格预测、波动性建模及衍生品定价提供高质量、结构化的历史基准。其精细的时间颗粒度与多维特征为探索数字资产市场的微观结构、流动性模式及投资者情绪演化奠定了数据基础,推动了计算金融学在加密资产领域的实证研究进展。
当前挑战
该数据集致力于应对加密货币时间序列预测中的核心挑战:市场非稳态性、高噪声环境下的信号提取,以及多因子驱动下的价格形成机制建模。具体而言,分钟级数据中蕴含的剧烈波动、流动性突变与市场操纵痕迹,对预测模型的稳健性与泛化能力构成严峻考验。在构建层面,挑战源于海量实时数据的采集、清洗与一致性维护,需克服交易所API的速率限制、网络延迟及数据断点问题。此外,将异构的K线数据与衍生指标整合为统一的时序数据库,并确保其时间对齐与数值精度,亦是一项复杂的工程技术挑战。
常用场景
经典使用场景
在数字货币量化分析领域,高频交易策略的研发与验证依赖于精细的历史市场数据。该数据集以其分钟级OHLCV结构和涵盖多币种的期货指标,为量化回测提供了理想的基础。研究人员能够基于此构建并测试各类算法交易模型,从简单的趋势跟踪到复杂的机器学习驱动策略,均可在真实历史环境中评估其表现与稳健性。
解决学术问题
该数据集有效应对了加密货币市场研究中数据质量与连续性的挑战。其高精度时间序列解决了传统金融模型在极端波动性资产上应用时的数据粒度不足问题,支持对市场微观结构、波动率聚类以及跨资产相关性的深入探究。通过整合持仓量、多空比等衍生指标,数据集进一步赋能了市场情绪与资金流向的量化分析,推动了行为金融学在数字资产领域的理论发展。
实际应用
超越学术研究,该数据集在工业界具有广泛的实际价值。金融科技公司利用其进行自动化交易系统的实时风险监控与策略优化。投资机构则依赖其中的期货指标数据,分析市场主力动向与散户情绪,以辅助衍生品定价与对冲决策。此外,数据服务商可基于此构建可视化分析平台,为普通投资者提供深度的市场洞察工具。
数据集最近研究
最新研究方向
在加密货币量化金融领域,币安期货OHLCV数据集因其高精度分钟级K线及期货指标,正成为前沿研究的核心资源。当前研究聚焦于融合深度学习与高频时序分析,利用其多空比、持仓量等衍生指标,构建市场情绪与价格波动的动态关联模型。随着算法交易与去中心化金融的演进,该数据集支撑着跨币种波动率预测、极端行情风险监测等热点课题,为理解加密资产微观结构提供了实证基础,显著推动了智能投顾与自动化策略的科学发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作