pokemon-showdown-replays

Hugging Face2025-07-17 更新2025-07-18 收录

下载链接：

https://huggingface.co/datasets/HolidayOugi/pokemon-showdown-replays

下载链接

链接失效反馈

官方服务：

资源简介：

Pokémon Showdown回放数据集，包含多个由Pokémon Showdown公共回放组成的数据集，用于学术研究和项目开发。数据集覆盖从2005年到2025年的回放，包含不同世代和格式的数据，具体数据量根据世代不同而有所差异。

The Pokémon Showdown Replay Dataset consists of multiple sub-datasets composed of public Pokémon Showdown replays, and is intended for academic research and project development. This dataset covers replays spanning from 2005 to 2025, includes data across different Pokémon generations and battle formats, with the specific data volume varying by generation.

创建时间：

2025-07-08

原始信息汇总

Pokémon Showdown Replay Datasets 概述

数据集基本信息

任务类别: 特征提取
标签: pokemon, showdown, replays
数据集名称: Pokémon Showdown Replays
数据规模: 1M<n<10M

数据集来源与用途

来源: 通过Pokémon Showdown API收集的公开对战回放
用途: 为社区提供项目开发的起点
关联项目: 用于大学项目Showdown Shower

数据时间范围

回放日期: 2005年至2025年

数据集统计（截至2025年7月16日）

世代/格式	Gen 1	Gen 2	Gen 3	Gen 4	Gen 5	Gen 6	Gen 7	Gen 8	Gen 9	总计
ANYTHINGGOES				2.292	56	447.075	767.364	11.956	79.675	1.308.418
UBERS	4.010	2.534	7.833	14.208	86.157	444.027	376.640	54.866	62.152	1.052.427
OU	89.840	45.006	207.984	179.289	581.929	2.760.215	2.279.520	510.635	1.411.549	8.065.967
UU	2.941	2.095	2.824	7.399	69.101	354.851	257.185	48.598	236.606	981.600
RU	88		500		30.615	82.188	100.485	20.690	129.952	364.518
NU	2.335	1.414	1.916	2.114	62.175	115.914	65.374	12.751	92.188	356.181
PU	1.534	269	508	1.046	1.933	79.447	100.564	12.120	102.453	299.874
ZU	934	194	1.854	343	682	420	26.260	3.988	8.442	43.117
总计	101.682	51.512	223.419	206.691	832.648	4.284.137	3.973.392	675.604	2.123.017	12.472.102

搜集汇总

数据集介绍

构建方式

在数字游戏研究领域，Pokémon Showdown Replays数据集通过官方API系统性地采集了2005至2025年间公开的宝可梦对战录像。该数据集采用分代分级的架构设计，按照九代游戏版本和八种对战规则进行矩阵式分类，通过自动化脚本实时捕获并校验超过1247万条对战记录，确保数据的时间连续性和格式标准化。数据采集过程严格遵循平台用户协议，所有录像均经过匿名化处理以保护玩家隐私。

使用方法

研究者可通过HuggingFace平台直接加载预处理后的Parquet格式文件，各子集按'generation_format'字段进行逻辑划分。推荐使用polars或pandas进行时序分析，对战日志中的JSON字段需特殊解析。该数据集已成功应用于Showdown Shower等大学研究项目，特别适合用于玩家行为模式挖掘、对战AI训练以及游戏平衡性分析。对于机器学习任务，建议将回合操作序列转化为token进行建模，并注意不同世代间的数据分布差异。

背景与挑战

背景概述

Pokémon Showdown Replays数据集是由HolidayOugi等研究人员基于Pokémon Showdown平台公开的对战回放数据构建而成，旨在为游戏AI和策略分析研究提供丰富的实战数据资源。该数据集收录了2005至2025年间涵盖九代游戏版本的多种对战模式回放，总规模超过1200万条记录，被应用于大学研究项目Showdown Shower中。作为目前规模最大的宝可梦对战数据集合，其跨世代、多模式的特点为研究游戏平衡性、玩家行为模式和AI训练提供了独特价值。

当前挑战

该数据集面临的核心挑战体现在两个方面：在领域问题层面，宝可梦对战具有复杂的属性克制机制和技能组合策略，如何从海量回放中提取有效的战术特征并建立评估模型仍需突破；在构建技术层面，不同世代游戏规则的迭代导致数据标准化困难，且原始API数据包含大量非结构化战斗日志，需要进行复杂的清洗和标注工作。此外，对战模式的多样性也要求研究者开发适应不同规则集的统一分析方法。

常用场景

经典使用场景

在游戏AI与策略分析领域，Pokémon Showdown Replays数据集为研究者提供了丰富的对战回放数据。通过对不同世代、不同对战格式的玩家决策进行深度挖掘，该数据集常被用于构建强化学习模型，模拟玩家行为并优化AI对战策略。尤其在OU（OverUsed）等主流对战环境中，数百万条对战记录为研究复杂决策树提供了理想样本。

解决学术问题

该数据集有效解决了游戏AI领域缺乏大规模真实对战数据的问题。学者们利用这些带有时间戳的完整对战记录，能够量化分析元游戏演变规律、技能组合收益以及队伍构建策略。跨世代的数据纵向对比，更为研究游戏机制迭代对玩家行为模式的影响提供了独特视角，填补了电子竞技数据分析的理论空白。

实际应用

实际应用中，电竞平台利用该数据集开发智能观战系统，实时生成战术分析报告。游戏开发商通过挖掘高频技能组合数据优化平衡性调整，而教育领域则将其转化为博弈论教学案例。在Showdown Shower等第三方工具中，这些数据实现了对战统计可视化，帮助玩家提升竞技水平。

数据集最近研究