five

bmoney1321/polymarket-crypto-5m-15m

收藏
Hugging Face2026-03-13 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/bmoney1321/polymarket-crypto-5m-15m
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit task_categories: - time-series-forecasting tags: - polymarket - crypto - prediction-markets - order-books - trades - bitcoin - ethereum - solana - xrp pretty_name: Polymarket Crypto 5m/15m Market Data size_categories: - 100K<n<1M --- # Polymarket Crypto 5-Minute & 15-Minute Market Data High-frequency data from Polymarket's crypto up/down prediction markets. Covers **BTC, ETH, SOL, XRP** across 5-minute and 15-minute windows. Updated daily. All timestamps are **UTC**. Last updated: 2026-03-13 01:55 UTC ## Data Summary | Dataset | Rows | First Date | Last Date | |---------|------|-----------|----------| | **orderbooks** | 3,415,267 | 2026-01-09 | 2026-03-13 | | **trades** | 23,241,033 | 2026-01-27 | 2026-03-13 | | **price_history** | 304,340 | 2026-03-06 | 2026-03-13 | | **crypto_prices** | 37,480 | 2026-03-06 | 2026-03-13 | | **markets** | 17,389 | — | — | | **resolutions** | 17,972 | — | — | ## Subsets ### orderbooks 10-level order book snapshots captured every 10 seconds. | Column | Type | Description | |--------|------|-------------| | timestamp | datetime | Snapshot time (UTC) | | asset | string | BTC, ETH, SOL, XRP | | market_id | string | Market slug | | token_id | string | CLOB token ID | | best_bid | float | Highest bid price | | best_ask | float | Lowest ask price | | spread | float | best_ask - best_bid | | mid_price | float | (best_bid + best_ask) / 2 | | bid_levels | json | Top 10 bid levels | | ask_levels | json | Top 10 ask levels | ### trades Individual trade executions from the Polymarket Data API. | Column | Type | Description | |--------|------|-------------| | timestamp | datetime | Trade time (UTC) | | asset | string | BTC, ETH, SOL, XRP | | market_id | string | Market slug | | side | string | BUY or SELL | | price | float | Trade price (0-1) | | size | float | Trade size in USDC | | tx_hash | string | Transaction hash | ### resolutions Final outcomes for resolved markets. | Column | Type | Description | |--------|------|-------------| | market_id | string | Market slug | | asset | string | BTC, ETH, SOL, XRP | | resolved_at | datetime | Resolution time (UTC) | | outcome | string | Up or Down | ### markets Market metadata and configuration. ### price_history 1-minute price points from CLOB API for Polymarket market tokens. | Column | Type | Description | |--------|------|-------------| | timestamp | datetime | Price time (UTC, rounded to minute) | | asset | string | BTC, ETH, SOL, XRP | | market_id | string | Market slug | | token_id | string | CLOB token ID | | price | float | Mid-price (0-1) | ### crypto_prices 1-minute OHLCV candles for underlying crypto assets from Binance. | Column | Type | Description | |--------|------|-------------| | timestamp | datetime | Candle open time (UTC) | | asset | string | BTC, ETH, SOL, XRP | | open | float | Open price (USD) | | high | float | High price (USD) | | low | float | Low price (USD) | | close | float | Close price (USD) | | volume | float | Trading volume | | trade_count | int | Number of trades | ## Usage ```python from datasets import load_dataset # Load trades trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades") # Load order books books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks") # Load resolutions resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions") # Load crypto spot prices (1-minute candles) crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices") ``` ## Collection Method Data is collected by an automated bot running 5 concurrent loops: - **Order books**: CLOB API `/book` every 10s - **Trades**: Data API `/trades` every 30s - **Resolutions**: Gamma API `/markets?closed=true` every 60s - **Market discovery**: Gamma API `/events/slug/{slug}` every 2 min - **Price history**: CLOB `/book` every 60s for active market tokens - **Crypto prices**: Binance `/api/v3/klines` every 60s (BTC, ETH, SOL, XRP 1m candles) ## License MIT

许可证:MIT协议 任务类别: - 时间序列预测(time-series-forecasting) 标签: - Polymarket平台 - 加密货币 - 预测市场 - 订单簿 - 交易数据 - 比特币(BTC) - 以太坊(ETH) - 索拉纳(SOL) - 瑞波币(XRP) 友好名称:Polymarket加密货币5分钟/15分钟市场数据集 数据规模分类:10万<数据量<100万 # Polymarket加密货币5分钟与15分钟市场数据集 本数据集包含来自Polymarket加密货币涨跌预测市场的高频数据,覆盖比特币(BTC)、以太坊(ETH)、索拉纳(SOL)及瑞波币(XRP)的5分钟与15分钟时间窗口数据。 每日更新,所有时间戳均采用协调世界时(UTC)。 最后更新时间:2026年3月13日01:55 UTC ## 数据概览 | 数据集类型 | 行数 | 起始日期 | 结束日期 | |---------|------|-----------|----------| | **订单簿** | 3,415,267 | 2026-01-09 | 2026-03-13 | | **交易数据** | 23,241,033 | 2026-01-27 | 2026-03-13 | | **价格历史** | 304,340 | 2026-03-06 | 2026-03-13 | | **加密货币价格** | 37,480 | 2026-03-06 | 2026-03-13 | | **市场元数据** | 17,389 | — | — | | **结算数据** | 17,972 | — | — | ## 数据子集 ### 订单簿 每10秒捕获一次的10档订单簿快照。 | 字段名 | 数据类型 | 字段说明 | |--------|------|-------------| | timestamp | 日期时间型 | 快照时间(UTC) | | asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP | | market_id | 字符串型 | 市场标识(Market Slug) | | token_id | 字符串型 | CLOB代币标识 | | best_bid | 浮点型 | 最优买价 | | best_ask | 浮点型 | 最优卖价 | | spread | 浮点型 | 最优卖价 - 最优买价(买卖价差) | | mid_price | 浮点型 | (最优买价 + 最优卖价)/ 2(中间价) | | bid_levels | JSON格式 | 前10档买盘档位 | | ask_levels | JSON格式 | 前10档卖盘档位 | ### 交易数据 来自Polymarket数据API的单笔交易执行记录。 | 字段名 | 数据类型 | 字段说明 | |--------|------|-------------| | timestamp | 日期时间型 | 交易时间(UTC) | | asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP | | market_id | 字符串型 | 市场标识(Market Slug) | | side | 字符串型 | 交易方向:买入(BUY)或卖出(SELL) | | price | 浮点型 | 交易价格(区间0-1) | | size | 浮点型 | 交易规模(以USDC计价) | | tx_hash | 字符串型 | 交易哈希 | ### 结算数据 已结算市场的最终结果数据。 | 字段名 | 数据类型 | 字段说明 | |--------|------|-------------| | market_id | 字符串型 | 市场标识(Market Slug) | | asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP | | resolved_at | 日期时间型 | 结算时间(UTC) | | outcome | 字符串型 | 结算结果:上涨(Up)或下跌(Down) | ### 市场元数据 市场元数据与配置信息。 ### 价格历史 来自Polymarket集中限价订单簿(CLOB)API的市场代币1分钟价格点位数据。 | 字段名 | 数据类型 | 字段说明 | |--------|------|-------------| | timestamp | 日期时间型 | 价格时间(UTC,已按分钟取整) | | asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP | | market_id | 字符串型 | 市场标识(Market Slug) | | token_id | 字符串型 | CLOB代币标识 | | price | 浮点型 | 中间价(区间0-1) | ### 加密货币价格 来自币安(Binance)的原生加密资产1分钟OHLCV蜡烛图数据。 | 字段名 | 数据类型 | 字段说明 | |--------|------|-------------| | timestamp | 日期时间型 | 蜡烛图开盘时间(UTC) | | asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP | | open | 浮点型 | 开盘价(美元) | | high | 浮点型 | 最高价(美元) | | low | 浮点型 | 最低价(美元) | | close | 浮点型 | 收盘价(美元) | | volume | 浮点型 | 交易量 | | trade_count | 整型 | 交易笔数 | ## 使用方法 python from datasets import load_dataset # 加载交易数据 trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades") # 加载订单簿数据 books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks") # 加载结算数据 resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions") # 加载加密货币现货价格(1分钟蜡烛图) crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices") ## 采集方式 本数据集通过运行5个并发循环的自动化机器人采集: - **订单簿**:每10秒调用CLOB API的`/book`接口 - **交易数据**:每30秒调用Polymarket数据API的`/trades`接口 - **结算数据**:每60秒调用Gamma API的`/markets?closed=true`接口 - **市场发现**:每2分钟调用Gamma API的`/events/slug/{slug}`接口 - **价格历史**:每60秒为活跃市场代币调用CLOB的`/book`接口 - **加密货币价格**:每60秒调用币安`/api/v3/klines`接口获取BTC、ETH、SOL、XRP的1分钟蜡烛图数据 ## 许可证 MIT协议
提供机构:
bmoney1321
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作