pmxt-l2-dump
收藏Hugging Face2026-03-26 更新2026-03-27 收录
下载链接:
https://huggingface.co/datasets/phobia76/pmxt-l2-dump
下载链接
链接失效反馈官方服务:
资源简介:
PMXT Polymarket Orderbook Backup 是一个用于增量备份 `archive.pmxt.dev / r2.pmxt.dev` 上 PMXT Polymarket 小时 parquet 对象的数据集。数据集按 UTC 小时组织,保留了原始的 parquet 字节数据。包含 `meta/pmxt-polymarket-sync-state.json` 文件记录同步状态,以及 `meta/runs/` 目录保存每次同步的运行清单以供审计。数据集采用 MIT 许可证,支持英文和中文,适用于表格分类任务。需要注意的是,这是对象层保全,不代表已确认全量历史 L2 覆盖。
创建时间:
2026-03-26
原始信息汇总
PMXT Polymarket Orderbook Backup 数据集概述
数据集基本信息
- 许可证: MIT
- 任务类别: 表格分类
- 支持语言: 英语、中文
- 数据集名称: PMXT Polymarket Orderbook Backup
数据集内容与用途
- 本数据集仓库用于对
archive.pmxt.dev / r2.pmxt.dev上的 PMXT Polymarket 小时 parquet 对象进行增量备份。
数据组织与结构
- 数据文件按 UTC 小时进行组织。
- 文件保留了原始的 parquet 字节格式。
- 同步状态记录在
meta/pmxt-polymarket-sync-state.json文件中。 - 每次同步的运行清单保存在
meta/runs/目录下,以便于审计。
重要边界说明
- 此备份为对象层保全,不保证已确认全量的历史 L2 覆盖范围。
搜集汇总
数据集介绍

构建方式
在去中心化预测市场领域,数据完整性对于市场分析和模型训练至关重要。PMXT Polymarket Orderbook Backup数据集通过自动化同步流程,从`archive.pmxt.dev`和`r2.pmxt.dev`源端,以UTC小时为单位增量抓取并备份Polymarket订单簿的parquet格式对象。每个文件均保留了原始字节数据,确保信息无损,同时通过`meta/pmxt-polymarket-sync-state.json`文件记录同步状态,并在`meta/runs/`目录下保存每次同步的运行清单,以提供完整的审计追踪能力。
使用方法
研究人员或开发者可利用此数据集进行预测市场流动性、价格发现机制或交易行为模式等方面的实证研究。使用前,建议首先查阅`meta/pmxt-polymarket-sync-state.json`以了解数据同步的覆盖范围与最新状态。数据以parquet文件格式提供,可直接使用支持该格式的数据处理框架(如Pandas、PyArrow)进行加载与分析。结合`meta/runs/`中的审计清单,用户可以精确复现特定时间段的数据上下文,从而确保研究过程的可重复性与严谨性。
背景与挑战
背景概述
PMXT Polymarket订单簿备份数据集于近年由PMXT项目团队创建,旨在系统性地归档Polymarket预测市场平台的小时级订单簿数据。作为去中心化金融与预测市场交叉领域的重要基础设施,该数据集通过捕获市场深度与流动性快照,为研究人员分析市场微观结构、价格发现机制及交易者行为模式提供了关键实证基础。其采用Parquet列式存储格式,按协调世界时每小时组织数据对象,并辅以同步状态元数据记录,体现了对高频金融时序数据完整性管理的严谨设计,对推动预测市场的透明度与量化研究具有实质性贡献。
当前挑战
该数据集核心挑战在于解决预测市场领域订单簿数据长期保存与可复现性难题,具体包括:其一,数据覆盖完整性存疑,由于依赖增量备份机制,历史全量订单簿覆盖范围尚未完全确认,可能影响纵向研究的连贯性;其二,构建过程中面临高频数据同步的时效性与一致性挑战,需确保分布式存储对象与源端数据字节级一致,同时应对网络中断或格式变更导致的数据断层风险。此外,Parquet格式虽提升存储效率,但需配套元数据审计体系以保障数据溯源可靠性,增加了系统复杂性。
常用场景
经典使用场景
在金融市场微观结构研究中,PMXT Polymarket Orderbook Backup数据集为预测市场订单簿动态提供了关键数据基础。该数据集以小时粒度记录了Polymarket平台上的订单簿快照,研究者可借此分析订单流、流动性变化以及市场深度等核心指标。通过解析这些高频数据,能够深入理解预测市场的价格形成机制与交易者行为模式,为构建精准的市场预测模型奠定实证基础。
解决学术问题
该数据集有效解决了预测市场与去中心化金融领域内关于市场效率与信息聚合的学术研究问题。通过提供结构化的订单簿历史记录,它使得学者能够实证检验市场反应速度、价格发现效率以及流动性供给机制等理论假设。其意义在于为新兴的预测市场提供了首个公开可用的微观交易数据集,推动了该领域从理论推导向实证分析的范式转变,对理解非传统金融市场的运作规律具有深远影响。
实际应用
在实际应用层面,该数据集为开发基于订单簿信号的量化交易策略提供了直接支持。交易员与算法开发者可利用这些历史订单流数据,回测和优化其做市策略、套利模型或市场时机选择算法。同时,平台运营方也能借助这些数据监控市场健康度,识别异常交易行为,从而增强市场的稳定性和透明度。这些应用直接服务于提升预测市场的运作效率和风险管理能力。
数据集最近研究
最新研究方向
在去中心化预测市场领域,PMXT Polymarket订单簿备份数据集正成为量化金融与区块链交叉研究的前沿焦点。该数据集以小时粒度记录Polymarket平台的订单簿快照,为分析市场微观结构、流动性动态及信息效率提供了高频率时序数据。当前研究热点集中于利用此类数据构建预测模型,以探索市场情绪与真实世界事件的关联性,例如政治选举或气候灾害等热点事件的预测准确性验证。其影响在于推动了链上金融数据的标准化与可审计性,为开发去中心化金融(DeFi)风险管理和监管科技工具奠定了实证基础,深化了市场预测理论在加密经济中的实践意义。
以上内容由遇见数据集搜集并总结生成



