usamaahmedsh/elliott-wave-market-data-complete
收藏Hugging Face2026-02-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/usamaahmedsh/elliott-wave-market-data-complete
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- time-series-forecasting
tags:
- finance
- stocks
- crypto
- forex
- commodities
- etfs
- elliott-wave
- technical-analysis
- ohlcv
- quality-validated
- neural-network-training
pretty_name: Elliott Wave Market Data Complete (Quality Validated)
size_categories:
- 10M<n<100M
---
# Elliott Wave Market Data - Complete (Quality Validated) ✅
**Production-ready, quality-validated** OHLCV market data for training Elliott Wave pattern recognition neural networks.
## 🎯 Key Features
- **Quality Validated**: Rigorous data quality checks applied
- **Complete Coverage**: 1,403 unique instruments
- **Multi-Timeframe**: 1h, 4h, 1d, 1wk data
- **22,546,189 Total Data Points**
## Dataset Statistics
| Timeframe | Rows | Tickers |
|-----------|------|---------|
| 1h | 9,267,368 | 1,358 |
| 4h | 2,849,583 | 1,358 |
| 1d | 8,648,514 | 1,399 |
| 1wk | 1,780,724 | 1,396 |
## Asset Classes
This dataset includes:
- Commodities
- Commodities Extended
- Crypto
- Crypto Extended
- Emerging Markets
- Etfs
- Fixed Income
- Forex
- Forex Extended
- Indices
- Indices Extended
- International
- Leveraged
- Nasdaq
- Reits
- Small Cap
- Stocks
- Thematic Etfs
## Quality Validation
All data has passed these quality checks:
- ✅ OHLC consistency (High ≥ Low, etc.)
- ✅ No missing values in required fields
- ✅ No duplicate rows
- ✅ No zero/negative prices
- ✅ No negative volume
- ✅ Extreme outliers removed (>1000% single-bar moves)
- ✅ Minimum 50 bars per ticker/timeframe
- ✅ Valid datetime formatting
- ✅ No future dates
## Data Schema
| Column | Type | Description |
|--------|------|-------------|
| datetime | datetime64 | Bar timestamp |
| open | float64 | Opening price |
| high | float64 | Highest price |
| low | float64 | Lowest price |
| close | float64 | Closing price |
| volume | float64 | Trading volume |
| ticker | string | Instrument symbol |
| interval | string | Timeframe (1h/4h/1d/1wk) |
| source_category | string | Asset category |
## Usage
```python
import pandas as pd
# Load all daily data
df = pd.read_parquet("hf://datasets/usamaahmedsh/elliott-wave-market-data-complete/market_data_1d.parquet")
# Filter by category
stocks = df[df['source_category'] == 'stocks']
crypto = df[df['source_category'] == 'crypto']
# Filter by ticker
aapl = df[df['ticker'] == 'AAPL']
btc = df[df['ticker'] == 'BTC-USD']
```
## Data Sources
- Primary: Yahoo Finance (via yfinance)
- All data adjusted for splits/dividends
## License
MIT License - Free for academic and commercial use.
## Generated
2026-02-27 16:03 UTC
许可证:MIT许可证
任务类别:
- 时间序列预测
标签:
- 金融
- 股票
- 加密货币
- 外汇
- 大宗商品
- 交易所交易基金(ETFs)
- 艾略特波浪
- 技术分析
- OHLCV
- 质量验证
- 神经网络训练
美观名称:经过质量验证的完整艾略特波浪市场数据集
规模类别:
- 1000万<n<1亿
# 经过质量验证的完整艾略特波浪市场数据集 ✅
**可投入生产、经质量验证**的OHLCV市场数据,用于训练艾略特波浪形态识别神经网络。
## 🎯 核心特性
- **质量验证**:经过严格的数据质量校验流程
- **覆盖全面**:包含1403种独特交易标的
- **多时间框架**:涵盖1小时、4小时、1日、1周四个时间粒度
- **总数据点数达22,546,189**
## 数据集统计
| 时间框架 | 数据行数 | 标的数量 |
|---------|---------|---------|
| 1小时 | 9,267,368 | 1,358 |
| 4小时 | 2,849,583 | 1,358 |
| 1日 | 8,648,514 | 1,399 |
| 1周 | 1,780,724 | 1,396 |
## 资产类别
本数据集包含以下品类:
- 大宗商品
- 扩展大宗商品品类
- 加密货币
- 扩展加密货币品类
- 新兴市场资产
- 交易所交易基金(ETFs)
- 固定收益类资产
- 外汇
- 扩展外汇品类
- 股票指数
- 扩展股票指数品类
- 国际市场资产
- 杠杆类产品
- 纳斯达克市场标的
- 房地产投资信托基金(REITs)
- 小盘股
- 个股
- 主题型交易所交易基金(ETFs)
## 质量验证流程
所有数据均通过以下校验:
- ✅ OHLC数据一致性(最高价≥最低价等合规性校验)
- ✅ 必填字段无缺失值
- ✅ 无重复数据行
- ✅ 无零值或负向价格
- ✅ 无负向交易量
- ✅ 移除极端异常值(单根K线波动超过1000%的样本)
- ✅ 每个标的/时间框架组合至少包含50根K线数据
- ✅ 符合标准日期时间格式
- ✅ 无未来日期数据
## 数据结构
| 字段名 | 数据类型 | 字段说明 |
|--------|---------|---------|
| datetime | datetime64 | K线时间戳 |
| open | float64 | 开盘价 |
| high | float64 | 最高价 |
| low | float64 | 最低价 |
| close | float64 | 收盘价 |
| volume | float64 | 交易量 |
| ticker | string | 交易标的代码 |
| interval | string | 时间粒度(1h/4h/1d/1wk) |
| source_category | string | 资产类别标签 |
## 使用示例
python
import pandas as pd
# 加载所有日线级数据
df = pd.read_parquet("hf://datasets/usamaahmedsh/elliott-wave-market-data-complete/market_data_1d.parquet")
# 按资产类别筛选
stocks = df[df['source_category'] == 'stocks']
crypto = df[df['source_category'] == 'crypto']
# 按标的代码筛选
aapl = df[df['ticker'] == 'AAPL']
btc = df[df['ticker'] == 'BTC-USD']
## 数据来源
- 主要数据源:雅虎财经(通过yfinance库获取)
- 所有数据均已进行拆股、分红调整
## 许可证
MIT许可证——可免费用于学术研究与商业用途。
## 生成时间
2026年2月27日 16:03 UTC
提供机构:
usamaahmedsh



