five

polymarket-historical-prices

收藏
Hugging Face2026-04-23 更新2026-04-24 收录
下载链接:
https://huggingface.co/datasets/manja316/polymarket-historical-prices
下载链接
链接失效反馈
官方服务:
资源简介:
Polymarket历史价格数据集是一个专注于金融和预测市场的开源数据集,包含超过9.5M的价格快照,覆盖9,550个预测市场。数据集以15分钟为分辨率,提供连续30天的数据。主要内容包括市场元数据(问题、类别、交易量、流动性、解决日期)、YES/NO结果的15分钟价格快照以及买卖深度快照。数据集通过自动化管道24/7收集,每15分钟刷新一次。适用于时间序列预测和量化金融任务。分析发现,价格暴跌超过20%后,市场在15分钟内恢复6.6%的概率为78%。数据集为免费样本,完整数据集需购买。
创建时间:
2026-04-18
原始信息汇总

Polymarket Historical Prices 数据集概述

基本信息

  • 许可证: Creative Commons Attribution 4.0 International (CC-BY-4.0)
  • 任务类别: 时间序列预测
  • 标签: 金融、预测市场、Polymarket、交易、量化金融
  • 数据集规模: 100万至1000万条记录
  • 数据集名称: Polymarket Historical Prices

数据集内容

该数据集包含 超过950万条价格快照,覆盖 9,550个预测市场,提供 15分钟分辨率30天连续数据

数据表结构

表名称 行数 描述
markets 9,550+ 市场元数据 — 问题、类别、交易量、流动性、结算日期
prices 9,300,000+ 每15分钟的价格快照(YES/NO结果)
orderbooks 792,000+ 买卖盘口深度快照

数据发现

基于该数据集的分析发现:价格暴跌超过20%后,市场在15分钟内反弹+6.6%,发生概率为78%。该均值回归模式在280笔真实交易中实现了80%的胜率。

数据采集

通过自动化管道 全天候采集,数据源为Polymarket Gamma API和CLOB API,每15分钟刷新一次

主要发现

  • 价格恢复模式: 暴跌20%后78%概率快速反弹
  • 交易胜率: 基于均值回归策略达到80%

相关数据集

  • 加密货币交叉信号数据集: 包含BTC/ETH/SOL + Gold + Polymarket加密货币概率数据
  • 崩溃恢复策略模板: 可执行的Python代码及完整回测

联系方式

  • 邮箱: LuciferForge@proton.me
  • X平台: @gmanjuu
搜集汇总
数据集介绍
main_image_url
构建方式
Polymarket Historical Prices 数据集依托自动化数据采集管道构建,全天候从 Polymarket 的 Gamma API 与 CLOB API 持续抓取数据。系统以 15 分钟为间隔进行快照刷新,覆盖了超过 9,550 个预测市场的定价信息,每个市场均记录 YES/NO 二元结果的实时价格。最终数据集整合了 930 万条以上的价格快照,以及 79.2 万条买卖盘口深度数据,形成了一个高频率、细粒度的时间序列集合。
特点
该数据集的核心亮点在于其规模与时效性——汇聚了 950 万以上价格样本与 9,550 个市场元数据,且以 15 分钟的高分辨率连续覆盖 30 天的交易活动。研究分析揭示了一个显著统计规律:当市场价格骤然下跌超过 20% 后,有 78% 的概率在 15 分钟内反弹约 6.6%,这一均值回归模式在 280 次实盘交易中取得了 80% 的胜率,凸显了数据集对量化策略开发的内在价值。
使用方法
用户可通过 Hugging Face Datasets 库直接加载该数据集的免费样本(最新时间切片),快速探查市场元数据表、价格历史表与订单簿快照表。对于需要完整 30 天历史数据的深入分析,支持通过 Gumroad 平台购买完整数据集或订阅每周自动刷新的实时版本。此外,还可配合配套的崩溃恢复策略笔记与回测模板,高效复现并验证基于该数据的高频交易策略。
背景与挑战
背景概述
该数据集由研究人员通过自动化管道于2024年构建,旨在捕捉去中心化预测市场Polymarket上的价格动态。Polymarket作为区块链驱动的预测平台,其交易数据为量化金融与时间序列预测提供了独特的研究窗口。数据集包含逾9500个市场的近千万条价格快照,以15分钟为分辨率,覆盖30天连续观测,聚焦YES/NO二元结果的定价行为。核心研究问题在于如何利用高频预测市场数据识别统计套利机会,例如价格崩溃后的均值回复模式。其对相关领域的影响力体现在:为行为金融学提供了自然实验场景,同时服务于高频交易策略的开发与回测,推动预测市场与传统金融时间序列分析的交叉融合。
当前挑战
该数据集所解决的领域问题聚焦于预测市场微观结构中的非理性定价与短暂失衡。传统金融数据难以捕捉此类去中心化市场的独特波动规律,例如信息传播延迟导致的短暂价格偏离。构建过程中面临多重挑战:Polymarket Gamma API与CLOB API的实时数据流稳定性需24/7维护,且不同市场流动性差异显著,部分市场交易稀疏导致快照代表性不足。此外,15分钟采样间隔可能遗漏秒级突变,而YES/NO二元结果的价差耦合关系增加了特征工程难度。数据清洗需处理价格粘性及异常波动,同时协调多源API的时间戳同步问题,确保时序分析的严谨性。
常用场景
经典使用场景
Polymarket Historical Prices 数据集以其高频率、跨市场的价格快照特性,成为预测市场与时间序列预测研究的理想选择。该数据集涵盖超过9500个预测市场、逾950万条15分钟分辨率的价格记录,特别适用于短期价格动态建模、波动率分析及市场微观结构研究。在经典使用场景中,研究者常利用其精确的时序数据构建市场情绪指标,或通过价格序列的统计特性捕捉异常波动模式,例如基于均值回复效应的短线交易策略验证。此外,该数据集还可作为监督学习的基准,用于训练模型预测二元结果事件的概率演化轨迹,从而推动预测市场与金融时间序列交叉领域的理论发展。
实际应用
在实际应用中,该数据集为量化交易、风险管理和事件博弈提供了坚实的数据基础。交易团队可利用其价格序列开发高频统计套利策略,尤其是捕捉预测市场中的短期均值回复与动量效应,如基于暴跌后反弹规律的自动化交易机器人已展现出80%的胜率。风险管理者则可借助深度快照数据监控市场流动性突变,识别极端行情下的清算风险。此外,该数据集还赋能了事件驱动型对冲策略的设计,帮助机构投资者在政治选举、体育赛事或宏观经济事件公布前,通过预测市场概率的实时变化构建跨资产组合的避险头寸。
衍生相关工作
该数据集催生了多项引领预测市场与金融科技发展的开源工具与研究成果。其中最具代表性的当属基于价格暴跌后均值回复模式开发的崩溃恢复策略,该策略已转化为可执行的Python交易机器人模板,并在实盘验证中录得高胜率表现。此外,研究者还联合加密货币与贵金属市场数据构建了跨信号预测数据集,扩展了多资产联动分析的能力边界。数据采集与处理流程本身也衍生出自动化管道技术文档,为后续构建实时预测市场数据生态提供了可复用的基础设施。这些相关工作不仅验证了数据集的核心发现,更推动了从理论模型到生产级代码的转化链条。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作