bmoney1321/polymarket-crypto-5m-15m
收藏Hugging Face2026-03-13 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/bmoney1321/polymarket-crypto-5m-15m
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- time-series-forecasting
tags:
- polymarket
- crypto
- prediction-markets
- order-books
- trades
- bitcoin
- ethereum
- solana
- xrp
pretty_name: Polymarket Crypto 5m/15m Market Data
size_categories:
- 100K<n<1M
---
# Polymarket Crypto 5-Minute & 15-Minute Market Data
High-frequency data from Polymarket's crypto up/down prediction markets. Covers **BTC, ETH, SOL, XRP** across 5-minute and 15-minute windows.
Updated daily. All timestamps are **UTC**.
Last updated: 2026-03-13 01:55 UTC
## Data Summary
| Dataset | Rows | First Date | Last Date |
|---------|------|-----------|----------|
| **orderbooks** | 3,415,267 | 2026-01-09 | 2026-03-13 |
| **trades** | 23,241,033 | 2026-01-27 | 2026-03-13 |
| **price_history** | 304,340 | 2026-03-06 | 2026-03-13 |
| **crypto_prices** | 37,480 | 2026-03-06 | 2026-03-13 |
| **markets** | 17,389 | — | — |
| **resolutions** | 17,972 | — | — |
## Subsets
### orderbooks
10-level order book snapshots captured every 10 seconds.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Snapshot time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| token_id | string | CLOB token ID |
| best_bid | float | Highest bid price |
| best_ask | float | Lowest ask price |
| spread | float | best_ask - best_bid |
| mid_price | float | (best_bid + best_ask) / 2 |
| bid_levels | json | Top 10 bid levels |
| ask_levels | json | Top 10 ask levels |
### trades
Individual trade executions from the Polymarket Data API.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Trade time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| side | string | BUY or SELL |
| price | float | Trade price (0-1) |
| size | float | Trade size in USDC |
| tx_hash | string | Transaction hash |
### resolutions
Final outcomes for resolved markets.
| Column | Type | Description |
|--------|------|-------------|
| market_id | string | Market slug |
| asset | string | BTC, ETH, SOL, XRP |
| resolved_at | datetime | Resolution time (UTC) |
| outcome | string | Up or Down |
### markets
Market metadata and configuration.
### price_history
1-minute price points from CLOB API for Polymarket market tokens.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Price time (UTC, rounded to minute) |
| asset | string | BTC, ETH, SOL, XRP |
| market_id | string | Market slug |
| token_id | string | CLOB token ID |
| price | float | Mid-price (0-1) |
### crypto_prices
1-minute OHLCV candles for underlying crypto assets from Binance.
| Column | Type | Description |
|--------|------|-------------|
| timestamp | datetime | Candle open time (UTC) |
| asset | string | BTC, ETH, SOL, XRP |
| open | float | Open price (USD) |
| high | float | High price (USD) |
| low | float | Low price (USD) |
| close | float | Close price (USD) |
| volume | float | Trading volume |
| trade_count | int | Number of trades |
## Usage
```python
from datasets import load_dataset
# Load trades
trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades")
# Load order books
books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks")
# Load resolutions
resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions")
# Load crypto spot prices (1-minute candles)
crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices")
```
## Collection Method
Data is collected by an automated bot running 5 concurrent loops:
- **Order books**: CLOB API `/book` every 10s
- **Trades**: Data API `/trades` every 30s
- **Resolutions**: Gamma API `/markets?closed=true` every 60s
- **Market discovery**: Gamma API `/events/slug/{slug}` every 2 min
- **Price history**: CLOB `/book` every 60s for active market tokens
- **Crypto prices**: Binance `/api/v3/klines` every 60s (BTC, ETH, SOL, XRP 1m candles)
## License
MIT
许可证:MIT协议
任务类别:
- 时间序列预测(time-series-forecasting)
标签:
- Polymarket平台
- 加密货币
- 预测市场
- 订单簿
- 交易数据
- 比特币(BTC)
- 以太坊(ETH)
- 索拉纳(SOL)
- 瑞波币(XRP)
友好名称:Polymarket加密货币5分钟/15分钟市场数据集
数据规模分类:10万<数据量<100万
# Polymarket加密货币5分钟与15分钟市场数据集
本数据集包含来自Polymarket加密货币涨跌预测市场的高频数据,覆盖比特币(BTC)、以太坊(ETH)、索拉纳(SOL)及瑞波币(XRP)的5分钟与15分钟时间窗口数据。
每日更新,所有时间戳均采用协调世界时(UTC)。
最后更新时间:2026年3月13日01:55 UTC
## 数据概览
| 数据集类型 | 行数 | 起始日期 | 结束日期 |
|---------|------|-----------|----------|
| **订单簿** | 3,415,267 | 2026-01-09 | 2026-03-13 |
| **交易数据** | 23,241,033 | 2026-01-27 | 2026-03-13 |
| **价格历史** | 304,340 | 2026-03-06 | 2026-03-13 |
| **加密货币价格** | 37,480 | 2026-03-06 | 2026-03-13 |
| **市场元数据** | 17,389 | — | — |
| **结算数据** | 17,972 | — | — |
## 数据子集
### 订单簿
每10秒捕获一次的10档订单簿快照。
| 字段名 | 数据类型 | 字段说明 |
|--------|------|-------------|
| timestamp | 日期时间型 | 快照时间(UTC) |
| asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP |
| market_id | 字符串型 | 市场标识(Market Slug) |
| token_id | 字符串型 | CLOB代币标识 |
| best_bid | 浮点型 | 最优买价 |
| best_ask | 浮点型 | 最优卖价 |
| spread | 浮点型 | 最优卖价 - 最优买价(买卖价差) |
| mid_price | 浮点型 | (最优买价 + 最优卖价)/ 2(中间价) |
| bid_levels | JSON格式 | 前10档买盘档位 |
| ask_levels | JSON格式 | 前10档卖盘档位 |
### 交易数据
来自Polymarket数据API的单笔交易执行记录。
| 字段名 | 数据类型 | 字段说明 |
|--------|------|-------------|
| timestamp | 日期时间型 | 交易时间(UTC) |
| asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP |
| market_id | 字符串型 | 市场标识(Market Slug) |
| side | 字符串型 | 交易方向:买入(BUY)或卖出(SELL) |
| price | 浮点型 | 交易价格(区间0-1) |
| size | 浮点型 | 交易规模(以USDC计价) |
| tx_hash | 字符串型 | 交易哈希 |
### 结算数据
已结算市场的最终结果数据。
| 字段名 | 数据类型 | 字段说明 |
|--------|------|-------------|
| market_id | 字符串型 | 市场标识(Market Slug) |
| asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP |
| resolved_at | 日期时间型 | 结算时间(UTC) |
| outcome | 字符串型 | 结算结果:上涨(Up)或下跌(Down) |
### 市场元数据
市场元数据与配置信息。
### 价格历史
来自Polymarket集中限价订单簿(CLOB)API的市场代币1分钟价格点位数据。
| 字段名 | 数据类型 | 字段说明 |
|--------|------|-------------|
| timestamp | 日期时间型 | 价格时间(UTC,已按分钟取整) |
| asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP |
| market_id | 字符串型 | 市场标识(Market Slug) |
| token_id | 字符串型 | CLOB代币标识 |
| price | 浮点型 | 中间价(区间0-1) |
### 加密货币价格
来自币安(Binance)的原生加密资产1分钟OHLCV蜡烛图数据。
| 字段名 | 数据类型 | 字段说明 |
|--------|------|-------------|
| timestamp | 日期时间型 | 蜡烛图开盘时间(UTC) |
| asset | 字符串型 | 标的资产:BTC、ETH、SOL、XRP |
| open | 浮点型 | 开盘价(美元) |
| high | 浮点型 | 最高价(美元) |
| low | 浮点型 | 最低价(美元) |
| close | 浮点型 | 收盘价(美元) |
| volume | 浮点型 | 交易量 |
| trade_count | 整型 | 交易笔数 |
## 使用方法
python
from datasets import load_dataset
# 加载交易数据
trades = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="trades")
# 加载订单簿数据
books = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="orderbooks")
# 加载结算数据
resolutions = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="resolutions")
# 加载加密货币现货价格(1分钟蜡烛图)
crypto = load_dataset("obadiaha/polymarket-crypto-5m-15m", data_dir="crypto_prices")
## 采集方式
本数据集通过运行5个并发循环的自动化机器人采集:
- **订单簿**:每10秒调用CLOB API的`/book`接口
- **交易数据**:每30秒调用Polymarket数据API的`/trades`接口
- **结算数据**:每60秒调用Gamma API的`/markets?closed=true`接口
- **市场发现**:每2分钟调用Gamma API的`/events/slug/{slug}`接口
- **价格历史**:每60秒为活跃市场代币调用CLOB的`/book`接口
- **加密货币价格**:每60秒调用币安`/api/v3/klines`接口获取BTC、ETH、SOL、XRP的1分钟蜡烛图数据
## 许可证
MIT协议
提供机构:
bmoney1321



