lol-ultimate-events-challenger-10m

Hugging Face2025-05-25 更新2025-05-26 收录

下载链接：

https://huggingface.co/datasets/gptilt/lol-ultimate-events-challenger-10m

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含来自10K场《英雄联盟》高排名（Challenger）比赛的1000万条丰富事件的数据集。数据集提供了每个事件的详尽时间线，包括游戏内事件（如英雄击杀、物品购买、放置守卫、建筑击杀、精英野怪击杀）的时间戳和上下文信息。数据来源于官方Riot Games API，并以Parquet文件格式存储，分为美洲、亚洲、欧洲三个区域。

This is a dataset containing 10 million rich event records from 10,000 high-ranked (Challenger tier) *League of Legends* competitive matches. The dataset provides detailed timelines for each event, including timestamps and contextual information for in-game events such as champion kills, item purchases, ward placements, structure takedowns, and elite monster slays. The data is sourced from the official Riot Games API, stored in Parquet file format, and partitioned into three regional subsets: Americas, Asia, and Europe.

创建时间：

2025-05-18

原始信息汇总

数据集概述：GPTilt: 10M Enriched Events from 10K LoL Challenger Matches

数据集简介

名称：10M Enriched Events from 10K LoL Challenger Matches
提供方：GPTilt开源项目
目的：为研究和分析提供高质量《英雄联盟》数据，促进数据科学与AI在游戏理解中的应用
数据来源：Riot Games API和CDragon

数据集内容

数据量：包含10,000场高段位（Challenger）比赛的1000万条丰富事件记录
主要语言：英语
数据结构：
- 表名：events
- 内容：详细的时间线事件（如CHAMPION_KILL、ITEM_PURCHASED等），包含时间戳、游戏状态（玩家位置、物品栏、等级）和赛前状态（英雄、符文等）
- 字段示例： json { "matchId": "LA2_1495348800", "eventId": 10, "timestamp": 194787, "type": "LEVEL_UP", "inventory_0": [1421, 3500], "level_0": 12 }

数据集结构

数据文件格式：Parquet
分区：
- region_americas
- region_asia
- region_europe

数据集创建

数据收集：
1. 通过league-v4端点识别高段位玩家PUUIDs
2. 使用match-v5端点获取比赛ID和时间线数据
3. 原始数据保存为JSON格式，后转换为Parquet文件
生产者：
- 游戏数据由《英雄联盟》高段位玩家生成
- Riot Games API提供数据接口
- GPTilt项目贡献者负责收集和处理

使用限制

许可：Creative Commons Attribution-NonCommercial 4.0 International
适用用途：
- 非商业研究
- 数据分析
- 机器学习模型训练
禁止用途：
- 违反Riot Games API服务条款的行为
- 任何商业用途

引用方式

bibtex @misc{gptilt_10m_enriched_events_from_10k_lol_challenger_matches, author = { GPTilt Contributors }, title = { 10M Enriched Events from 10K LoL Challenger Matches }, year = { 2025 }, publisher = { Hugging Face }, journal = { Hugging Face Hub }, url = { https://huggingface.co/datasets/gptilt/lol-ultimate-events-challenger-10m } }

注意事项

包含PUUIDs和Participant IDs等伪匿名标识符
数据仅代表Challenger段位，不适用于其他段位
使用时需遵守Riot Games API条款

搜集汇总

数据集介绍

构建方式

该数据集源自GPTilt开源项目，旨在为《英雄联盟》研究提供高质量数据支持。数据采集依托Riot Games官方API，通过league-v4端点识别挑战者段位玩家PUUID，继而使用match-v5端点获取比赛时间线数据。原始JSON响应经解析转换后，按美洲、亚洲、欧洲三大区域分区存储为Parquet格式，形成包含1000万条事件的精细化数据集。数据处理流程严格遵循API调用规范，确保数据采集的合法性与时效性。

特点

数据集聚焦挑战者段位对局，囊括CHAMPION_KILL、ITEM_PURCHASED等关键事件类型，每条记录均附带时间戳、游戏状态上下文及赛前配置信息。独特之处在于其三维数据结构：事件类型维度记录战斗交互细节，玩家状态维度捕捉装备等级变化，区域维度反映不同服务器生态特征。数据采用matchId-eventId双层索引体系，可与基础比赛数据集无缝衔接，为多粒度分析提供可能。

使用方法

研究者可通过Hugging Face datasets库快速加载数据，支持按区域分片读取或全量加载。典型应用场景包括：基于事件序列的战术模式挖掘，结合游戏状态的强化学习建模，跨区域玩家行为对比分析等。使用需注意遵守Riot Games API条款，特别规避玩家去匿名化行为。数据集采用CC BY-NC 4.0许可，商业用途需额外授权，学术引用建议采用提供的BibTeX格式。

背景与挑战

背景概述

《lol-ultimate-events-challenger-10m》数据集由GPTilt开源项目于2025年发布，旨在为《英雄联盟》游戏研究提供高质量、大规模的分析数据。该数据集聚焦于顶尖段位（Challenger）的竞技对局，收录了来自美洲、亚洲和欧洲三大赛区的10万场比赛中的1000万条游戏事件数据。通过系统化采集Riot Games官方API的赛事时间线数据，研究团队构建了包含击杀、装备购买、视野布置等关键事件的细粒度记录，并附带了游戏状态上下文信息。这一数据资源的建立填补了MOBA类游戏战略分析领域缺乏公开基准数据集的空白，为探索高段位玩家的战术决策模式、英雄交互机制等复杂问题提供了实证基础。

当前挑战

该数据集面临多重挑战：在领域问题层面，高段位对局特有的战术复杂度导致事件间非线性关联显著，传统时序建模方法难以捕捉深层战略逻辑；游戏版本迭代带来的机制变化（如装备系统重做）使得跨版本泛化研究存在困难。在构建过程中，Riot API的速率限制制约了数据采集规模，而多赛区数据的时间异步性增加了时序对齐复杂度；原始JSON数据的嵌套结构需经多级解析才能转化为可分析的平面表结构，且游戏事件类型的不平衡分布（如精英野怪击杀事件稀少）可能影响模型训练效果。此外，玩家匿名化处理虽符合隐私规范，但给行为模式的连续性研究带来挑战。

常用场景

经典使用场景

在电子竞技数据分析领域，lol-ultimate-events-challenger-10m数据集为研究者提供了高分段玩家对局中丰富的事件序列数据。该数据集最经典的使用场景在于分析英雄联盟顶级玩家在比赛中的决策模式和行为特征，通过时间戳标记的各类游戏事件（如英雄击杀、物品购买、守卫布置等），研究者能够深入探究高分段对局中的战术执行节奏和资源分配策略。

衍生相关工作

基于该数据集衍生的经典工作主要集中在两个方向：一是开发预测模型分析比赛走势，如基于事件序列的胜率预测系统；二是构建游戏AI训练框架，包括模仿学习高分段玩家决策模式的智能体。这些工作推动了游戏AI从规则驱动向数据驱动范式的转变，为多智能体协作研究提供了新的实验平台。

数据集最近研究