five

phobia76/pmxt-l2-dump

收藏
Hugging Face2026-05-02 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/phobia76/pmxt-l2-dump
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集是一个非官方的镜像/备份,用于保全PMXT公开提供的Polymarket小时parquet对象。它包含了PMXT Polymarket的订单簿数据,按UTC小时组织,并保留原始parquet字节。数据集的主要来源是PMXT Database Dumps,许可遵循CC BY 4.0。

This dataset is an unofficial mirror/backup for preserving the hourly parquet objects publicly provided by PMXT Polymarket. It includes order book data from PMXT Polymarket, organized by UTC hours and retaining the original parquet bytes. The primary source of the dataset is PMXT Database Dumps, and it is licensed under CC BY 4.0.
提供机构:
phobia76
搜集汇总
数据集介绍
main_image_url
构建方式
在金融预测分析领域,数据集的构建方式直接影响其可靠性与应用价值。PMXT Polymarket Orderbook Backup数据集通过非官方镜像机制,系统性地保全了PMXT公开提供的Polymarket小时级别订单簿数据。该过程依托上游PMXT数据库的公开接口,以UTC小时为粒度自动抓取并存储原始Parquet格式文件,同时通过元数据文件记录同步状态与运行清单,确保数据追溯的透明性与完整性。这种构建方式既维护了数据的原始性,又通过结构化备份为研究提供了稳定访问渠道。
特点
该数据集的特点体现在其高度专业化与结构清晰性上。作为Polymarket预测市场订单簿的备份,它专注于小时级别的交易深度数据,并以Parquet格式保留原始字节,保障了数据的完整性与处理效率。数据集支持中英双语元数据,且严格遵循上游的CC BY 4.0许可协议,强调了合规性与可追溯性。通过同步状态文件和审计清单,研究人员能够清晰把握数据覆盖范围与更新历程,为时序分析与市场微观结构研究提供了可靠基础。
使用方法
使用该数据集时,建议优先考虑上游PMXT存档以确保数据时效性。研究人员可通过Hugging Face平台访问镜像文件,直接加载Parquet格式的小时粒度订单簿数据进行处理。典型应用场景包括预测市场流动性分析、交易行为模式挖掘以及金融时序模型训练。在合规使用方面,需遵循CC BY 4.0许可要求,并参考元数据中的同步记录评估数据覆盖范围,以适配具体研究问题的时序需求。
背景与挑战
背景概述
随着去中心化预测市场的兴起,Polymarket作为基于区块链的金融平台,其订单簿数据为研究市场微观结构、交易行为及信息效率提供了关键资源。PMXT-L2-Dump数据集由PMXT项目组于近年创建,旨在通过非官方镜像形式保全Polymarket平台公开的小时级订单簿parquet文件,服务于金融科技与计算社会科学领域的研究人员。该数据集以CC BY 4.0许可开放,覆盖多语言环境,核心研究问题聚焦于去中心化市场中订单流的动态模式、流动性演化及价格发现机制,为量化金融与区块链交叉学科提供了实证基础。
当前挑战
在去中心化预测市场领域,订单簿数据分析面临市场碎片化、高频噪声以及跨链数据异构性等挑战,PMXT-L2-Dump需解决订单簿深度重建、异常交易检测及跨时间序列一致性等复杂问题。数据集构建过程中,同步流程依赖上游PMXT存档的稳定性,面临数据覆盖不全、时间戳对齐偏差及parquet格式版本兼容性等技术障碍;同时,作为非官方镜像,其长期维护需应对上游许可变更与存储架构更新的风险,确保数据保全的完整性与可追溯性。
常用场景
经典使用场景
在预测市场与金融科技领域,PMXT Polymarket Orderbook Backup数据集为研究人员提供了高频订单簿数据的结构化存档。其经典使用场景集中于市场微观结构分析,通过解析每小时更新的parquet格式订单簿快照,学者能够深入探究流动性提供者行为、价格发现机制以及市场效率的动态演变。这类数据尤其适用于构建时间序列模型,以检验信息不对称条件下交易者决策的理性边界,为量化金融理论提供实证基础。
解决学术问题
该数据集有效解决了预测市场中订单簿动态可视性与历史覆盖不足的学术挑战。通过系统化保全Polymarket平台的小时级订单簿快照,研究者得以追溯市场深度与价差的时序变化,从而检验市场操纵假说、评估事件驱动型交易的冲击成本。其意义在于为去中心化预测市场建立了首个可公开审计的高频数据基准,推动了博弈论与市场设计理论在加密经济场景中的融合创新。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在三个方向:一是基于订单簿不平衡指标的预测模型,如利用深度强化学习优化做市策略;二是跨市场信息传导研究,通过对比中心化交易所与预测市场的订单流,揭示加密货币市场的价格领导关系;三是开发开源数据管道工具链,例如将parquet快照转换为标准化tick数据库的ETL框架,显著降低了学术界获取高频预测市场数据的门槛。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作