polymarket-BTC5min-database
收藏github2026-04-16 更新2026-04-19 收录
下载链接:
https://github.com/CronosVirus00/polymarket-BTC5min-database
下载链接
链接失效反馈官方服务:
资源简介:
这是一个来自Polymarket BTC 5分钟市场的订单簿快照集合,用于测试您的机器人和策略。数据集包含Unix时间戳、slug、资产ID、前100个买价和卖价、原始订单簿等信息,格式为Apache Parquet。
This is a collection of order book snapshots sourced from the Polymarket BTC 5-minute market, designed for testing trading bots and strategies. The dataset encompasses Unix timestamps, slugs, asset IDs, the top 100 bid and ask prices, raw order books, and other related information, and is stored in Apache Parquet format.
创建时间:
2026-04-13
原始信息汇总
polymarket-BTC5min-database 数据集概述
数据集基本信息
- 数据集名称: polymarket-BTC5min-database
- 数据内容: 来自Polymarket比特币5分钟预测市场的订单簿快照集合,用于测试交易机器人和策略。
- 资产类型: 比特币(BTC)预测市场
- 数据频率: 5分钟快照
- 数据格式: Apache Parquet(高度压缩,可在Python/R中快速加载)
- 许可证: 知识共享署名4.0国际许可协议(CC BY 4.0)
数据内容与结构
- 包含字段: Unix时间戳、市场slug、资产ID、前100个买单价位(bids)、前100个卖单价位(asks)、原始订单簿数据(raw orderbook)。
- 文件命名规则: slug_保存时间(Unix时间)。
- 数据模式(Schema):
- timestamp: double
- slug: large_string
- asset_id: large_string
- bids: large_string
- asks: large_string
- raw_data: large_string
数据采集方法
- 通过WebSocket订阅BTC5min市场,并保存订单簿的每一次变动。
- 每接收300次更新,将接收到的数据创建一个Parquet文件。
- 自动切换到当前的5分钟市场,因此给定市场的数据从该市场开始时记录。
数据使用与解析
下载方式
通过GitHub仓库的绿色“Code”按钮,选择“Download ZIP”下载数据。
Python解析示例
需要pandas和pyarrow库。 python import pyarrow.parquet as pq import pandas as pd import json
读取文件
dataset = pq.read_table(FOLDER-WITH-THE-PARQUET-FILES) df = dataset.to_pandas() df[timestamp] = pd.to_datetime(df[timestamp], unit=s)
访问数据示例
first_book = json.loads(df.loc[0, raw_bdata]) bids = first_book.get(bids)
参考资源
- 关于订单簿结构和使用的官方Polymarket文档:
- 价格与订单簿:https://docs.polymarket.com/concepts/prices-orderbook
- 通过WebSocket接收订单簿:https://docs.pymarket.com/market-data/websocket/market-channel
- WebSocket概述:https://docs.polymarket.com/market-data/websocket/overview
免责声明
此数据仅用于教育和测试目的。加密货币市场存在风险。作者不对因使用此数据造成的任何财务损失负责。
项目支持
如果此数据集对您的交易机器人有用,可考虑支持该数据集的维护:
- BTC地址:
3N2g1KRu4L87g3sYAn8EbPxF9NSX9vDtJa - USDC地址:
comin
搜集汇总
数据集介绍

构建方式
在加密货币预测市场领域,polymarket-BTC5min-database通过订阅Polymarket平台的BTC五分钟市场WebSocket数据流构建而成。数据采集过程实时捕捉订单簿的每一次变动,每积累300次更新后,系统将接收到的数据整合并存储为高度压缩的Apache Parquet格式文件。这种自动化机制确保了数据从每个市场周期起始时刻开始连续记录,为高频交易策略的回测提供了精准的时间序列基础。
特点
该数据集以比特币预测市场为核心,聚焦于五分钟间隔的订单簿快照,涵盖了时间戳、市场标识、资产编号及前100档买卖盘深度等关键字段。其采用Parquet列式存储格式,兼具高效压缩与快速读取优势,显著提升了在Python或R环境中的数据处理效率。数据集结构紧密遵循Polymarket官方规范,原始订单簿信息以JSON字符串形式完整保留,为量化分析提供了透明且一致的数据接口。
使用方法
用户可通过下载压缩包获取数据文件,并借助pandas与pyarrow库在Python环境中直接读取Parquet数据集。加载后的数据可转换为DataFrame进行操作,时间戳字段支持转换为易读的日期时间对象。订单簿的原始JSON数据可通过解析获取买卖盘明细,便于开发交易机器人或进行市场微观结构研究。数据集适用于教育测试场景,为策略验证与算法优化提供了可靠的实验基础。
背景与挑战
背景概述
随着区块链技术与加密货币市场的蓬勃发展,预测市场作为一种新兴的金融衍生工具,逐渐成为量化交易与市场微观结构研究的重要领域。Polymarket-BTC5min-database数据集由匿名研究者于近期构建,专注于捕捉Polymarket平台上比特币5分钟预测市场的订单簿快照。该数据集以高频、结构化的方式记录了市场深度信息,包括买卖盘口的前100档报价及原始订单数据,旨在为算法交易策略的测试与验证提供可靠的数据支持。其采用Apache Parquet格式存储,兼顾了压缩效率与读取速度,显著促进了加密货币预测市场在量化分析与机器学习应用中的实证研究。
当前挑战
在加密货币预测市场领域,订单簿数据的实时性与完整性对于交易策略的回测至关重要,然而市场波动剧烈与流动性变化常导致数据稀疏性问题,这为构建稳健的预测模型带来挑战。数据集构建过程中,研究者需持续通过WebSocket连接捕获高频市场更新,并每300次更新生成快照文件,这一过程对数据采集的稳定性与实时性提出了较高要求。同时,订单簿数据的多维度结构,如买卖盘口的嵌套JSON格式,增加了数据解析与清洗的复杂性,要求使用者具备较强的数据处理能力以有效提取特征。此外,预测市场的短期特性与合约更迭,使得数据在时间序列上的连续性维护成为另一项技术难点。
常用场景
经典使用场景
在加密货币预测市场领域,polymarket-BTC5min-database 数据集以其高频的订单簿快照为量化交易策略的研发提供了关键支持。该数据集记录了比特币5分钟预测市场的实时买卖盘数据,使得研究人员能够模拟市场微观结构,测试自动化交易算法在动态环境中的表现。通过分析订单簿的深度与流动性变化,用户可以评估策略在捕捉市场信号、执行套利或风险管理方面的有效性,从而优化交易系统的稳健性与适应性。
实际应用
在实际应用中,polymarket-BTC5min-database 数据集被广泛用于开发和回测自动化交易机器人,为加密货币预测市场的参与者提供了数据驱动的决策工具。交易者可以利用该数据集模拟历史市场条件,优化算法以识别套利机会或执行高频做市策略。同时,该数据也为金融科技公司提供了测试平台,用于评估新产品在真实市场环境中的性能,从而降低实际部署风险并提升系统可靠性。
衍生相关工作
基于该数据集,学术界与工业界衍生了一系列经典研究工作,主要集中在预测市场的高频数据分析与算法交易策略创新。例如,研究者利用订单簿快照开发了基于机器学习的市场趋势预测模型,探索了流动性冲击对价格波动的影响。此外,该数据还支持了去中心化金融(DeFi)中新型衍生品定价与风险度量方法的研究,促进了加密货币市场微观结构理论的深化与应用拓展。
以上内容由遇见数据集搜集并总结生成



