five

lol-ultimate-snapshot-challenger-15min

收藏
Hugging Face2025-05-26 更新2025-05-27 收录
下载链接:
https://huggingface.co/datasets/gptilt/lol-ultimate-snapshot-challenger-15min
下载链接
链接失效反馈
官方服务:
资源简介:
《英雄联盟》挑战者级别比赛15分钟快照数据集,包含在游戏进行到15分钟时的高级别比赛的完整快照。数据最初通过官方Riot Games API收集和处理。
创建时间:
2025-05-25
原始信息汇总

GPTilt: League of Legends Challenger Matches Snapshots At 15 Minutes 数据集概述

数据集简介

  • 内容:包含《英雄联盟》挑战者段位比赛在15分钟时的完整游戏快照。
  • 数据来源:通过Riot Games官方API收集和处理。
  • 语言:英语。

数据集结构

  • 主表snapshot

    • 包含比赛快照,涵盖击杀/助攻等上下文信息及赛前状态(英雄、符文等)。
    • 示例字段: json { "matchId": "LA2_1495348800", "kills_0": 6, "deaths_0": 2, "assists_0": 3, "inventory_0": [1421, 3500], "level_0": 12 }
  • 分区:按地区分为3个子集:

    • region_americas
    • region_asia
    • region_europe

数据获取

  • 安装工具: bash pip install datasets

  • 加载方式: python from datasets import load_dataset dataset = load_dataset("gptilt/lol-ultimate-snapshot-challenger-15min", name="snapshot")

创建背景

  • 目的:填补《英雄联盟》大规模公开分析数据集的空白,支持数据科学与AI技术应用。
  • 目标群体:专注挑战者段位玩家,捕捉高水准战略执行。

数据来源与处理

  1. 原始数据:来自Riot Games API和CDragon。
  2. 处理流程
    • 通过league-v4端点识别高段位玩家PUUID。
    • 使用match-v5端点获取比赛记录和时间线。
    • 原始JSON数据经解析后转换为Parquet格式,按地区分区。

限制与注意事项

  • 段位偏差:仅含挑战者段位数据,结论可能不适用于其他段位。
  • 地区偏差:各地区数据分布可能不均衡。
  • 版本偏差:数据反映特定游戏版本,不同版本间平衡性差异显著。
  • 隐私信息:包含PUUID等伪匿名标识符,需遵守Riot Games政策。

使用条款

  • 许可协议:Creative Commons Attribution-NonCommercial 4.0 International。
  • 适用场景:非商业研究、数据分析、机器学习模型训练等。
  • 禁止用途:违反Riot Games API服务条款的行为。

引用格式

bibtex @misc{gptilt_league_of_legends_challenger_matches_snapshots_at_15_minutes, author = { GPTilt Contributors }, title = { League of Legends Challenger Matches Snapshots At 15 Minutes }, year = { 2025 }, publisher = { Hugging Face }, journal = { Hugging Face Hub }, url = { https://huggingface.co/datasets/gptilt/lol-ultimate-snapshot-challenger-15min } }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建过程依托于Riot Games官方API与CDragon数据源,采用多阶段精细化处理流程。研究团队首先通过league-v4接口识别挑战者段位玩家PUUID,继而利用match-v5端点获取对战记录,最终提取15分钟关键节点的高精度对战快照。数据经过标准化解析后,按美洲、亚洲、欧洲三大区域进行分区存储,采用Parquet列式存储格式优化查询效率。
特点
作为聚焦英雄联盟顶级对局的高价值数据集,其核心优势体现在三个方面:完整记录挑战者段位15分钟关键节点的游戏状态,包含击杀数、装备组合等36项核心指标;数据结构采用matchId为主键,可实现与基础对战数据集和终极事件数据集的无缝关联;严格遵循Riot Games数据脱敏规范,仅保留必要的伪匿名化标识符。
使用方法
研究者可通过Hugging Face数据集库快速加载该资源,支持按区域分片读取或全局加载两种模式。典型应用场景包括:基于pandas或PySpark进行高阶游戏指标分析,利用Transformer架构构建战局预测模型,或结合OpenDota等工具进行多维可视化。需特别注意使用过程需严格遵守Riot Games API服务条款,尤其禁止任何试图反匿名化的操作。
背景与挑战
背景概述
《英雄联盟》作为全球最具影响力的多人在线战术竞技游戏之一,其高段位对局数据对于游戏策略分析与人工智能研究具有重要价值。lol-ultimate-snapshot-challenger-15min数据集由GPTilt开源项目于2025年构建,旨在填补该领域高质量公开数据集的空白。该项目通过Riot Games官方API系统采集了美洲、亚洲、欧洲三大战区最强王者段位的对局快照数据,聚焦比赛进行至15分钟时的完整游戏状态,包括击杀助攻、装备选择等关键指标。该数据集为研究高段位玩家的战术执行、版本Meta演变以及复杂游戏交互模式提供了标准化数据支持,推动了游戏数据分析从简单的胜负预测向深层策略理解的范式转变。
当前挑战
该数据集面临多重挑战:在领域问题层面,最强王者段位的特殊性与局限性导致数据难以泛化至其他段位,且不同战区的版本理解差异可能引入区域性偏差;游戏版本迭代带来的平衡性调整使得跨版本分析面临严峻的效度挑战。在构建过程中,API速率限制制约了数据采集规模,而原始数据缺乏语音交流等情境信息,难以完整还原决策背景。此外,如何在不违反Riot Games服务条款的前提下,妥善处理玩家伪匿名标识符(PUUIDs)的伦理使用问题,也是数据集应用需要持续关注的重点。
常用场景
经典使用场景
在电子竞技数据分析领域,lol-ultimate-snapshot-challenger-15min数据集为研究者提供了英雄联盟高端对局的关键时间节点快照。该数据集最经典的应用场景在于分析游戏前15分钟的战略布局与资源分配模式,研究者可通过击杀数、装备选择等维度,揭示顶尖玩家在游戏早期的决策规律与战术偏好。
衍生相关工作
基于该数据集衍生的经典研究包括《基于LSTM的英雄联盟胜负预测模型》,该工作创新性地将时序游戏状态转化为特征向量。另有学者开发了《多模态电竞解说生成系统》,通过结合游戏快照数据与实时解说语料,探索人工智能在电竞内容生产中的应用边界。
数据集最近研究
最新研究方向
近年来,随着电子竞技产业的蓬勃发展,游戏数据分析已成为人工智能与数据科学交叉领域的热点研究方向。该数据集聚焦于《英雄联盟》顶尖段位(Challenger)对局15分钟时点的完整快照数据,为探索高段位玩家战术决策模式提供了独特视角。当前研究主要围绕三个维度展开:基于时序动作序列的早期游戏策略预测模型构建、多模态特征融合的冠军强度动态评估体系,以及跨区域玩家行为差异的量化分析。特别是在大型语言模型技术兴起的背景下,该数据集被广泛应用于游戏状态表示学习的预训练任务,为构建领域专用的LLoLMs(League of Legends Language Models)提供了关键数据支撑。相关研究成果不仅推动了游戏智能体的开发,也为传统体育竞技分析提供了可迁移的方法论框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作