pokemon-showdown-replays
收藏Hugging Face2025-07-17 更新2025-07-18 收录
下载链接:
https://huggingface.co/datasets/HolidayOugi/pokemon-showdown-replays
下载链接
链接失效反馈官方服务:
资源简介:
Pokémon Showdown回放数据集,包含多个由Pokémon Showdown公共回放组成的数据集,用于学术研究和项目开发。数据集覆盖从2005年到2025年的回放,包含不同世代和格式的数据,具体数据量根据世代不同而有所差异。
创建时间:
2025-07-08
原始信息汇总
Pokémon Showdown Replay Datasets 概述
数据集基本信息
- 任务类别: 特征提取
- 标签: pokemon, showdown, replays
- 数据集名称: Pokémon Showdown Replays
- 数据规模: 1M<n<10M
数据集来源与用途
- 来源: 通过Pokémon Showdown API收集的公开对战回放
- 用途: 为社区提供项目开发的起点
- 关联项目: 用于大学项目Showdown Shower
数据时间范围
- 回放日期: 2005年至2025年
数据集统计(截至2025年7月16日)
| 世代/格式 | Gen 1 | Gen 2 | Gen 3 | Gen 4 | Gen 5 | Gen 6 | Gen 7 | Gen 8 | Gen 9 | 总计 |
|---|---|---|---|---|---|---|---|---|---|---|
| ANYTHINGGOES | 2.292 | 56 | 447.075 | 767.364 | 11.956 | 79.675 | 1.308.418 | |||
| UBERS | 4.010 | 2.534 | 7.833 | 14.208 | 86.157 | 444.027 | 376.640 | 54.866 | 62.152 | 1.052.427 |
| OU | 89.840 | 45.006 | 207.984 | 179.289 | 581.929 | 2.760.215 | 2.279.520 | 510.635 | 1.411.549 | 8.065.967 |
| UU | 2.941 | 2.095 | 2.824 | 7.399 | 69.101 | 354.851 | 257.185 | 48.598 | 236.606 | 981.600 |
| RU | 88 | 500 | 30.615 | 82.188 | 100.485 | 20.690 | 129.952 | 364.518 | ||
| NU | 2.335 | 1.414 | 1.916 | 2.114 | 62.175 | 115.914 | 65.374 | 12.751 | 92.188 | 356.181 |
| PU | 1.534 | 269 | 508 | 1.046 | 1.933 | 79.447 | 100.564 | 12.120 | 102.453 | 299.874 |
| ZU | 934 | 194 | 1.854 | 343 | 682 | 420 | 26.260 | 3.988 | 8.442 | 43.117 |
| 总计 | 101.682 | 51.512 | 223.419 | 206.691 | 832.648 | 4.284.137 | 3.973.392 | 675.604 | 2.123.017 | 12.472.102 |
搜集汇总
数据集介绍

构建方式
在数字游戏研究领域,Pokémon Showdown Replays数据集通过官方API系统性地采集了2005至2025年间公开的宝可梦对战录像。该数据集采用分代分级的架构设计,按照九代游戏版本和八种对战规则进行矩阵式分类,通过自动化脚本实时捕获并校验超过1247万条对战记录,确保数据的时间连续性和格式标准化。数据采集过程严格遵循平台用户协议,所有录像均经过匿名化处理以保护玩家隐私。
使用方法
研究者可通过HuggingFace平台直接加载预处理后的Parquet格式文件,各子集按'generation_format'字段进行逻辑划分。推荐使用polars或pandas进行时序分析,对战日志中的JSON字段需特殊解析。该数据集已成功应用于Showdown Shower等大学研究项目,特别适合用于玩家行为模式挖掘、对战AI训练以及游戏平衡性分析。对于机器学习任务,建议将回合操作序列转化为token进行建模,并注意不同世代间的数据分布差异。
背景与挑战
背景概述
Pokémon Showdown Replays数据集是由HolidayOugi等研究人员基于Pokémon Showdown平台公开的对战回放数据构建而成,旨在为游戏AI和策略分析研究提供丰富的实战数据资源。该数据集收录了2005至2025年间涵盖九代游戏版本的多种对战模式回放,总规模超过1200万条记录,被应用于大学研究项目Showdown Shower中。作为目前规模最大的宝可梦对战数据集合,其跨世代、多模式的特点为研究游戏平衡性、玩家行为模式和AI训练提供了独特价值。
当前挑战
该数据集面临的核心挑战体现在两个方面:在领域问题层面,宝可梦对战具有复杂的属性克制机制和技能组合策略,如何从海量回放中提取有效的战术特征并建立评估模型仍需突破;在构建技术层面,不同世代游戏规则的迭代导致数据标准化困难,且原始API数据包含大量非结构化战斗日志,需要进行复杂的清洗和标注工作。此外,对战模式的多样性也要求研究者开发适应不同规则集的统一分析方法。
常用场景
经典使用场景
在游戏AI与策略分析领域,Pokémon Showdown Replays数据集为研究者提供了丰富的对战回放数据。通过对不同世代、不同对战格式的玩家决策进行深度挖掘,该数据集常被用于构建强化学习模型,模拟玩家行为并优化AI对战策略。尤其在OU(OverUsed)等主流对战环境中,数百万条对战记录为研究复杂决策树提供了理想样本。
解决学术问题
该数据集有效解决了游戏AI领域缺乏大规模真实对战数据的问题。学者们利用这些带有时间戳的完整对战记录,能够量化分析元游戏演变规律、技能组合收益以及队伍构建策略。跨世代的数据纵向对比,更为研究游戏机制迭代对玩家行为模式的影响提供了独特视角,填补了电子竞技数据分析的理论空白。
实际应用
实际应用中,电竞平台利用该数据集开发智能观战系统,实时生成战术分析报告。游戏开发商通过挖掘高频技能组合数据优化平衡性调整,而教育领域则将其转化为博弈论教学案例。在Showdown Shower等第三方工具中,这些数据实现了对战统计可视化,帮助玩家提升竞技水平。
数据集最近研究
最新研究方向
在人工智能与游戏策略研究的交叉领域,Pokémon Showdown Replays数据集为学者提供了丰富的对战回放数据,涵盖了从第一代到第九代的不同对战模式。近年来,该数据集被广泛应用于强化学习算法的训练与评估,特别是在多智能体系统和复杂决策过程的研究中。研究者们利用这些数据探索宝可梦对战中的策略演化、元游戏动态以及玩家行为模式,为游戏AI的发展提供了重要参考。随着生成式AI技术的进步,该数据集还被用于构建更智能的对战机器人,模拟人类玩家的决策过程,推动了游戏AI的拟人化发展。
以上内容由遇见数据集搜集并总结生成



