ringside-analytics
收藏数据集概述:Ringside Analytics — 职业摔跤比赛档案
该数据集是一个结构化的职业摔跤历史关系型快照,时间跨度从1980年至今。数据来源于公开的 Cagematch.net 页面抓取和 alexdiresta 的 profightdb 转储,经过规范化处理后,以Parquet文件格式导出,保留了关系型结构(每个表一个文件,可通过 id 连接)。
数据集规模与统计
- 292,780 场比赛记录
- 611,515 条摔跤手-比赛参与记录
- 35,064 场赛事
- 12,814 名摔跤手
- 6 个主要摔跤联盟(WWE、AEW、WCW、ECW、NXT、TNA)
- 121 个冠军头衔
- 1,753 次冠军统治期
- 631 次角色转换(正派/反派/中立)
- 13,230 个别名记录
- 规模分类:100K < n < 1M
文件结构与描述
| 文件 | 行数 | 描述 |
|---|---|---|
| matches.parquet | 292,780 | 每场比赛一行,包括类型、条款、时长、是否为冠军赛、Cagematch评分 |
| match_participants.parquet | 611,515 | 每场比赛每位摔跤手一行,result 字段为比赛结果预测的标签 |
| wrestlers.parquet | 12,814 | 擂台名、真实姓名、性别、首秀日期、状态 |
| wrestler_aliases.parquet | 13,230 | 别名及其活跃时间段 |
| events.parquet | 35,064 | 赛事名称、日期、场馆、城市、国家、赛事类型 |
| promotions.parquet | 6 | 每个联盟及其成立/解散日期 |
| titles.parquet | 121 | 各联盟的冠军头衔 |
| title_reigns.parquet | 1,753 | 冠军统治开始/结束日期及卫冕次数 |
| alignment_turns.parquet | 631 | 摔跤手正派/反派/中立角色转变记录 |
| manifest.json | — | 导出清单:行数、列名、UTC时间戳 |
数据架构(连接键)
promotions.id ─┬─< wrestlers.primary_promotion_id ├─< events.promotion_id ├─< titles.promotion_id └─< wrestler_aliases.promotion_id
wrestlers.id ──┬─< match_participants.wrestler_id ├─< wrestler_aliases.wrestler_id ├─< title_reigns.wrestler_id └─< alignment_turns.wrestler_id
events.id ─────┬─< matches.event_id └─< alignment_turns.event_id (nullable)
matches.id ────── match_participants.match_id
titles.id ─────── title_reigns.title_id
数据用途与注意事项
- 该数据集是训练模型
theodorerubin/ringside-wrestling-archive-match-winner的源数据,可用于预测比赛结果、分析剧情安排模式等。 - 注意:职业摔跤是剧本表演,
result字段记录的是“被安排获胜”的结果,而非体育竞技胜负。 - 时间覆盖不均:2000年至今的数据较为完整,1980年代的数据较稀疏,尤其区域性联盟。
- 女子组样本量较小,相关模型置信区间可能较宽。
- Cagematch评分为用户众包评分,偏向于技术表现,可能偏离娱乐/剧情价值。
数据来源与许可
- 主要来源:Cagematch.net 公开HTML抓取(非商业用途)提供1990年至今的大部分比赛数据;alexdiresta 的 Kaggle 数据集(profightdb 转储)用于交叉验证和补充1990年前的覆盖。
- ETL代码:开源在 GitHub 仓库
tedrubin80/wrastlingfirst。 - 许可:采用 CC0 1.0(公共领域声明)。感谢引用,但非必须。底层来源(Cagematch.net、profightdb)有其自身条款。
引用格式
bibtex @dataset{ringside_analytics_2026, author = {Rubin, Theodore}, title = {Ringside Analytics: Pro Wrestling Match Archive (1980--present)}, year = {2026}, url = {https://www.kaggle.com/datasets/theodorerubin/ringside-wrestling-archive} }




