aliplayer1/polymarket-crypto-updown
收藏Hugging Face2026-04-26 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/aliplayer1/polymarket-crypto-updown
下载链接
链接失效反馈官方服务:
资源简介:
Polymarket加密上涨/下跌市场数据集是一个全面的加密货币价格变动二元预测市场数据集。涵盖了BTC、ETH、SOL、BNB、XRP、DOGE和HYPE等多种加密货币,以及多个时间框架(5分钟、15分钟、1小时、4小时)。数据集每3小时自动更新一次。包含多个子集:市场元数据、OHLC价格历史、交易级成交记录、连续现货价格流和最佳买卖盘快照。每个子集都有详细的列和类型描述,清晰地展示了数据结构。数据集以Parquet格式存储,采用Zstd压缩,并进行了Hive分区以便高效查询。数据由包括历史扫描、实时WebSocket捕获和定期上传的管道生成。
The Polymarket Crypto Up/Down Markets dataset is a comprehensive collection of binary prediction markets for cryptocurrency price movements. It covers BTC, ETH, SOL, BNB, XRP, DOGE, and HYPE across multiple timeframes (5-minute, 15-minute, 1-hour, 4-hour). The dataset is updated automatically every 3 hours. It includes several subsets: market metadata, OHLC price history, trade-level fills, continuous spot price feed, and best bid/ask snapshots. Each subset is described with its respective columns and types, providing a clear understanding of the data structure. The dataset is stored in Parquet format with Zstd compression and is Hive-partitioned for efficient querying. The data is produced by a pipeline that includes historical scans, live WebSocket captures, and regular uploads.
提供机构:
aliplayer1
搜集汇总
数据集介绍

构建方式
在去中心化金融与预测市场交叉领域,Polymarket Crypto Up/Down Markets 数据集通过一套自动化数据管道系统构建而成。该系统整合了历史扫描与实时流式处理:每六小时通过Gamma API回溯已结束市场的元数据与链上限价订单簿价格历史,并利用Polygon区块链回填链上交易记录;同时,一个持续运行的WebSocket服务实时捕获市场交易流、订单簿最佳买卖报价以及来自Binance和Chainlink的现货价格。所有数据经过整合后,每三小时以Parquet格式压缩上传,并采用Hive分区结构按加密货币种类与时间范围组织,确保了数据的高效存储与时效性。
特点
该数据集以其多维度、高粒度的结构而著称,涵盖了预测市场的完整生命周期。其核心特征在于同时提供市场元数据、OHLC价格序列、逐笔交易记录、连续现货价格以及订单簿快照五个子集,实现了从宏观市场概况到微观交易行为的全景覆盖。数据覆盖了比特币、以太坊等多种主流加密货币,并包含5分钟至4小时不同时间范围的预测市场,为研究市场效率、价格发现机制以及投资者行为提供了丰富的横截面与时间序列信息。通过整合链上与链下数据源,数据集兼具区块链交易的不可篡改性与实时市场数据的动态性。
使用方法
研究人员可通过Hugging Face Datasets库便捷加载特定子集,例如市场元数据或价格历史,进行时间序列预测或分类建模。数据集采用Parquet格式并支持Hive分区,使得用户能够利用DuckDB等查询引擎进行高效的数据筛选与分析,例如直接查询特定加密货币在特定时间范围内的价格数据。这种设计便于开展跨市场比较、波动性分析、交易策略回测以及预测市场与现货价格关联性等实证研究,为金融计量与计算社会科学领域提供了标准化的高质量数据基础。
背景与挑战
背景概述
Polymarket Crypto Up/Down Markets 数据集由独立研究者 aliplayer1 于近期构建并维护,专注于加密货币预测市场的量化分析。该数据集系统性地采集了 Polymarket 平台上关于主流加密货币价格涨跌的二元预测市场数据,涵盖比特币、以太坊等多种资产在不同时间尺度下的交易活动。其核心研究问题在于探索预测市场作为信息聚合机制的有效性,以及市场动态与底层资产价格之间的关联性,为金融计量学、行为经济学及去中心化金融(DeFi)领域提供了高颗粒度的实证研究基础。
当前挑战
该数据集旨在解决预测市场在加密货币领域的价格发现效率与信息整合能力评估问题,其挑战在于如何从嘈杂的市场交易数据中提取有效信号,并建模短期价格波动的群体预测准确性。构建过程中的挑战则体现于多源异构数据的实时同步与整合,包括处理链上事件与WebSocket流数据的时间戳对齐、确保不同数据子集在分区结构下的一致性,以及维持高频更新下数据管道的稳定与完整性。
常用场景
经典使用场景
在加密货币预测市场领域,Polymarket Crypto Up/Down Markets数据集为研究人员提供了丰富的二元期权交易数据,涵盖了比特币、以太坊等多种主流数字资产在不同时间粒度下的价格预测市场。该数据集常用于构建时间序列预测模型,通过分析市场订单簿、交易记录和实时价格,探索预测市场对加密货币短期价格波动的信号提取能力。研究者能够利用这些高频率数据,深入理解市场参与者的集体智慧如何反映在价格形成过程中,从而为金融计量学和行为金融学提供实证基础。
实际应用
在实际应用层面,该数据集被广泛应用于量化交易策略的开发、风险管理工具的构建以及市场情绪指标的衍生。交易机构可利用其中的订单簿和交易流数据,设计基于预测市场信号的套利或对冲策略;金融科技公司则能够从中提取市场情绪指数,为投资者提供加密货币短期走势的参考。此外,监管机构亦可借助此类数据监测预测市场的异常活动,评估其与传统金融市场的联动风险,从而提升金融体系的稳定性与透明度。
衍生相关工作
围绕该数据集衍生的经典工作主要包括预测市场与现货价格领先滞后关系的计量研究、基于深度学习的高频价格预测模型构建,以及去中心化预言机效率的实证分析。例如,多项研究利用其交易流数据验证了预测市场在极端波动事件中的信息优势;同时,结合订单簿和现货价格的跨市场套利模型也得以发展,推动了区块链金融工程领域的算法创新。这些工作不仅丰富了预测市场的理论框架,也为加密货币市场的量化分析提供了方法论借鉴。
以上内容由遇见数据集搜集并总结生成



