Radim462/polymarket-crypto-5m-15m
收藏Hugging Face2026-04-14 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Radim462/polymarket-crypto-5m-15m
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- time-series-forecasting
tags:
- polymarket
- crypto
- prediction-markets
- order-books
- trades
- bitcoin
- ethereum
- solana
- xrp
pretty_name: Polymarket Crypto 5m/15m Market Data
size_categories:
- 100K<n<1M
---
# Polymarket Crypto 5-Minute & 15-Minute Market Data
High-frequency data from Polymarket's crypto up/down prediction markets. Covers **BTC, ETH, SOL, XRP** across 5-minute and 15-minute windows.
Updated daily. All timestamps are **UTC**.
Last updated: 2026-03-13 01:55 UTC
## Data Summary
| Dataset | Rows | First Date | Last Date |
|---------|------|-----------|----------|
| **orderbooks** | 3,415,267 | 2026-01-09 | 2026-03-13 |
| **trades** | 23,241,033 | 2026-01-27 | 2026-03-13 |
| **price_history** | 304,340 | 2026-03-06 | 2026-03-13 |
| **crypto_prices** | 37,480 | 2026-03-06 | 2026-03-13 |
| **markets** | 17,389 | — | — |
| **resolutions** | 17,972 | — | — |
## Subsets
### orderbooks
10-level order book snapshots captured every 10 seconds.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Snapshot time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| token_id | string | CLOB token ID |
| best_bid | float | Highest bid price |
| best_ask | float | Lowest ask price |
| spread | float | best_ask - best_bid |
| mid_price | float | (best_bid + best_ask) / 2 |
| bid_levels | json | Top 10 bid levels |
| ask_levels | json | Top 10 ask levels |
### trades
Individual trade executions from the Polymarket Data API.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Trade time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| side | string | BUY or SELL |
| price | float | Trade price (0-1) |
| size | float | Trade size in USDC |
| tx_hash | string | Transaction hash |
### resolutions
Final outcomes for resolved markets.
| Column | Type | Description |
|--------|------|-------------|
| market_id | string | Market slug |
| asset | string | BTC, ETH, SOL, XRP |
| resolved_at | datetime | Resolution time (UTC) |
| outcome | string | Up or Down |
### markets
Market metadata and configuration.
### price_history
1-minute price points from CLOB API for Polymarket market tokens.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Price time (UTC, rounded to minute) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| token_id | string | CLOB token ID |
| price | float | Mid-price (0-1) |
### crypto_prices
1-minute OHLCV candles for underlying crypto assets from Binance.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Candle open time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| open | float | Open price (USD) |
| high | float | High price (USD) |
| low | float | Low price (USD) |
| close | float | Close price (USD) |
| volume | float | Trading volume |
| trade_count | int | Number of trades |
## Usage
```python
from datasets import load_dataset
# Load trades
trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades")
# Load order books
books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks")
# Load resolutions
resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions")
# Load crypto spot prices (1-minute candles)
crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices")
```
## Collection Method
Data is collected by an automated bot running 5 concurrent loops:
- **Order books**: CLOB API `/book` every 10s
- **Trades**: Data API `/trades` every 30s
- **Resolutions**: Gamma API `/markets?closed=true` every 60s
- **Market discovery**: Gamma API `/events/slug/{slug}` every 2 min
- **Price history**: CLOB `/book` every 60s for active market tokens
- **Crypto prices**: Binance `/api/v3/klines` every 60s (BTC, ETH, SOL, XRP 1m candles)
## License
MIT
许可证:MIT许可证
任务类别:
- 时序预测(time-series-forecasting)
标签:
- Polymarket
- 加密货币(crypto)
- 预测市场(prediction-markets)
- 订单簿(order-books)
- 交易记录(trades)
- 比特币(bitcoin)
- 以太坊(ethereum)
- 索拉纳(solana)
- 瑞波币(xrp)
数据集名称:Polymarket加密货币5分钟/15分钟市场数据集
数据规模类别:10万条 < 数据量 < 100万条
# Polymarket加密货币5分钟与15分钟市场数据集
本数据集收录自Polymarket加密货币涨跌预测市场的高频行情数据,覆盖比特币(BTC)、以太坊(ETH)、索拉纳(SOL)与瑞波币(XRP)的5分钟及15分钟级别的市场窗口数据。
每日更新,所有时间戳均采用协调世界时(UTC)。
最后更新时间:2026年3月13日01:55(UTC)
## 数据概览
| 数据集名称 | 数据行数 | 起始日期 | 终止日期 |
|---------|------|-----------|----------|
| **订单簿(orderbooks)** | 3,415,267 | 2026-01-09 | 2026-03-13 |
| **交易记录(trades)** | 23,241,033 | 2026-01-27 | 2026-03-13 |
| **价格历史(price_history)** | 304,340 | 2026-03-06 | 2026-03-13 |
| **加密货币价格(crypto_prices)** | 37,480 | 2026-03-06 | 2026-03-13 |
| **市场元数据(markets)** | 17,389 | — | — |
| **市场决议(resolutions)** | 17,972 | — | — |
## 子数据集
### 订单簿(orderbooks)
每10秒采集一次的10档深度订单簿快照。
| 字段名称 | 数据类型 | 字段说明 |
|--------|------|-------------|
| 时间戳 | 日期时间 | 快照采集时间(UTC) |
| 标的资产 | 字符串 | 取值为BTC、ETH、SOL、XRP |
| 市场标识 | 字符串 | 市场唯一别名(slug) |
| 通证标识 | 字符串 | 中央限价订单簿(CLOB)通证唯一标识 |
| 最优买价 | 浮点型 | 最高买单报价 |
| 最优卖价 | 浮点型 | 最低卖单报价 |
| 买卖价差 | 浮点型 | 等于最优卖价减去最优买价 |
| 中间价 | 浮点型 | 等于(最优买价+最优卖价)/2 |
| 买盘档位 | JSON格式 | 前10档买盘挂单档位 |
| 卖盘档位 | JSON格式 | 前10档卖盘挂单档位 |
### 交易记录(trades)
源自Polymarket数据API的单笔成交交易记录。
| 字段名称 | 数据类型 | 字段说明 |
|--------|------|-------------|
| 时间戳 | 日期时间 | 交易成交时间(UTC) |
| 标的资产 | 字符串 | 取值为BTC、ETH、SOL、XRP |
| 市场标识 | 字符串 | 市场唯一别名(slug) |
| 交易方向 | 字符串 | 取值为BUY(买入)或SELL(卖出) |
| 交易价格 | 浮点型 | 交易报价,取值范围0-1 |
| 交易规模 | 浮点型 | 以USDC(美元稳定币)计价的交易金额 |
| 交易哈希 | 字符串 | 交易的区块链哈希值 |
### 市场决议(resolutions)
已结算市场的最终结果数据。
| 字段名称 | 数据类型 | 字段说明 |
|--------|------|-------------|
| 市场标识 | 字符串 | 市场唯一别名(slug) |
| 标的资产 | 字符串 | 取值为BTC、ETH、SOL、XRP |
| 决议时间 | 日期时间 | 市场结算时间(UTC) |
| 结算结果 | 字符串 | 取值为Up(上涨)或Down(下跌) |
### 市场元数据(markets)
包含市场元信息与配置参数。
### 价格历史(price_history)
Polymarket市场通证的中央限价订单簿(CLOB)API 1分钟级价格点位数据。
| 字段名称 | 数据类型 | 字段说明 |
|--------|------|-------------|
| 时间戳 | 日期时间 | 价格采集时间(UTC,已舍入至分钟级) |
| 标的资产 | 字符串 | 取值为BTC、ETH、SOL、XRP |
| 市场标识 | 字符串 | 市场唯一别名(slug) |
| 通证标识 | 字符串 | 中央限价订单簿(CLOB)通证唯一标识 |
| 中间价 | 浮点型 | 市场中间报价,取值范围0-1 |
### 加密货币价格(crypto_prices)
源自币安(Binance)的底层加密资产1分钟级OHLCV(开盘-最高-最低-收盘-成交量)K线数据。
| 字段名称 | 数据类型 | 字段说明 |
|--------|------|-------------|
| 时间戳 | 日期时间 | K线开盘时间(UTC) |
| 标的资产 | 字符串 | 取值为BTC、ETH、SOL、XRP |
| 开盘价 | 浮点型 | 开盘价格(美元计价) |
| 最高价 | 浮点型 | 区间最高价格(美元计价) |
| 最低价 | 浮点型 | 区间最低价格(美元计价) |
| 收盘价 | 浮点型 | 收盘价格(美元计价) |
| 成交量 | 浮点型 | 区间总成交量 |
| 交易笔数 | 整型 | 区间内总交易笔数 |
## 使用方法
python
from datasets import load_dataset
# 加载交易记录数据集
trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades")
# 加载订单簿数据集
books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks")
# 加载市场决议数据集
resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions")
# 加载加密货币现货价格(1分钟K线数据)
crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices")
## 数据采集方法
本数据集通过运行5个并行循环的自动化机器人采集:
- **订单簿**:每10秒调用中央限价订单簿(CLOB)API的`/book`接口
- **交易记录**:每30秒调用Polymarket数据API的`/trades`接口
- **市场决议**:每60秒调用Gamma API的`/markets?closed=true`接口
- **市场发现**:每2分钟调用Gamma API的`/events/slug/{slug}`接口
- **价格历史**:每60秒调用CLOB API的`/book`接口获取活跃市场通证的价格数据
- **加密货币价格**:每60秒调用币安(Binance)的`/api/v3/klines`接口获取BTC、ETH、SOL、XRP的1分钟K线数据
## 许可证
MIT许可证
提供机构:
Radim462



