five

Bingsu/Gameplay_Images

收藏
Hugging Face2022-08-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Bingsu/Gameplay_Images
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en license: - cc-by-4.0 multilinguality: - monolingual pretty_name: Gameplay Images size_categories: - 1K<n<10K task_categories: - image-classification --- # Gameplay Images ## Dataset Description - **Homepage:** [kaggle](https://www.kaggle.com/datasets/aditmagotra/gameplay-images) - **Download Size** 2.50 GiB - **Generated Size** 1.68 GiB - **Total Size** 4.19 GiB A dataset from [kaggle](https://www.kaggle.com/datasets/aditmagotra/gameplay-images). This is a dataset of 10 very famous video games in the world. These include - Among Us - Apex Legends - Fortnite - Forza Horizon - Free Fire - Genshin Impact - God of War - Minecraft - Roblox - Terraria There are 1000 images per class and all are sized `640 x 360`. They are in the `.png` format. This Dataset was made by saving frames every few seconds from famous gameplay videos on Youtube. ※ This dataset was uploaded in January 2022. Game content updated after that will not be included. ### License CC-BY-4.0 ## Dataset Structure ### Data Instance ```python >>> from datasets import load_dataset >>> dataset = load_dataset("Bingsu/Gameplay_Images") DatasetDict({ train: Dataset({ features: ['image', 'label'], num_rows: 10000 }) }) ``` ```python >>> dataset["train"].features {'image': Image(decode=True, id=None), 'label': ClassLabel(num_classes=10, names=['Among Us', 'Apex Legends', 'Fortnite', 'Forza Horizon', 'Free Fire', 'Genshin Impact', 'God of War', 'Minecraft', 'Roblox', 'Terraria'], id=None)} ``` ### Data Size download: 2.50 GiB<br> generated: 1.68 GiB<br> total: 4.19 GiB ### Data Fields - image: `Image` - A `PIL.Image.Image object` containing the image. size=640x360 - Note that when accessing the image column: `dataset[0]["image"]` the image file is automatically decoded. Decoding of a large number of image files might take a significant amount of time. Thus it is important to first query the sample index before the "image" column, i.e. `dataset[0]["image"]` should always be preferred over `dataset["image"][0]`. - label: an int classification label. Class Label Mappings: ```json { "Among Us": 0, "Apex Legends": 1, "Fortnite": 2, "Forza Horizon": 3, "Free Fire": 4, "Genshin Impact": 5, "God of War": 6, "Minecraft": 7, "Roblox": 8, "Terraria": 9 } ``` ```python >>> dataset["train"][0] {'image': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=640x360>, 'label': 0} ``` ### Data Splits | | train | | ---------- | -------- | | # of data | 10000 | ### Note #### train_test_split ```python >>> ds_new = dataset["train"].train_test_split(0.2, seed=42, stratify_by_column="label") >>> ds_new DatasetDict({ train: Dataset({ features: ['image', 'label'], num_rows: 8000 }) test: Dataset({ features: ['image', 'label'], num_rows: 2000 }) }) ```

yaml language: - 英语 license: - CC BY 4.0 multilinguality: - 单语言 pretty_name: 游戏玩法截图 size_categories: - 1K<n<10K task_categories: - 图像分类 # 游戏玩法截图数据集 ## 数据集说明 - **主页**:[Kaggle](https://www.kaggle.com/datasets/aditmagotra/gameplay-images) - **下载大小**:2.50 GiB - **生成后大小**:1.68 GiB - **总大小**:4.19 GiB 本数据集源自Kaggle平台的[游戏玩法截图数据集](https://www.kaggle.com/datasets/aditmagotra/gameplay-images)。 本数据集包含全球10款极具知名度的电子游戏的相关截图,具体包括: - 《Among Us》(Among Us) - 《Apex英雄》(Apex Legends) - 《堡垒之夜》(Fortnite) - 《极限竞速:地平线》(Forza Horizon) - 《自由之火》(Free Fire) - 《原神》(Genshin Impact) - 《战神》(God of War) - 《我的世界》(Minecraft) - 《罗布乐思》(Roblox) - 《泰拉瑞亚》(Terraria) 每个类别包含1000张图片,所有图片均为640×360像素,格式为`.png`。 本数据集通过从YouTube上的知名游戏玩法视频中每隔数秒截取帧画面制作而成。 ※ 本数据集于2022年1月上传,2022年1月之后更新的游戏内容未被纳入本数据集。 ### 许可协议 CC BY 4.0 ## 数据集结构 ### 数据实例 python >>> from datasets import load_dataset >>> dataset = load_dataset("Bingsu/Gameplay_Images") DatasetDict({ train: Dataset({ features: ['image', 'label'], num_rows: 10000 }) }) python >>> dataset["train"].features {'image': Image(decode=True, id=None), 'label': ClassLabel(num_classes=10, names=['Among Us', 'Apex Legends', 'Fortnite', 'Forza Horizon', 'Free Fire', 'Genshin Impact', 'God of War', 'Minecraft', 'Roblox', 'Terraria'], id=None)} ### 数据大小 下载大小:2.50 GiB<br> 生成后大小:1.68 GiB<br> 总大小:4.19 GiB ### 数据字段 - **image**:`Image`类型 - 为`PIL.Image.Image`对象,承载单张图像,尺寸为640×360像素 - 注意:当直接访问`dataset[0]["image"]`时,图像文件会自动解码。若需处理大量图像文件,解码过程可能耗费较长时间。因此建议优先通过样本索引访问图像字段,即优先使用`dataset[0]["image"]`而非`dataset["image"][0]`。 - **label**:整数类型的分类标签。 类别标签映射关系如下: json { "Among Us": 0, "Apex Legends": 1, "Fortnite": 2, "Forza Horizon": 3, "Free Fire": 4, "Genshin Impact": 5, "God of War": 6, "Minecraft": 7, "Roblox": 8, "Terraria": 9 } python >>> dataset["train"][0] {'image': <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=640x360>, 'label': 0} ### 数据划分 | | 训练集 | | ---------- | -------- | | 样本数量 | 10000 | ### 注意事项 #### 训练集测试集划分 python >>> ds_new = dataset["train"].train_test_split(0.2, seed=42, stratify_by_column="label") >>> ds_new DatasetDict({ train: Dataset({ features: ['image', 'label'], num_rows: 8000 }) test: Dataset({ features: ['image', 'label'], num_rows: 2000 }) })
提供机构:
Bingsu
原始信息汇总

Gameplay Images 数据集概述

数据集描述

  • 数据集名称: Gameplay Images
  • 下载大小: 2.50 GiB
  • 生成大小: 1.68 GiB
  • 总大小: 4.19 GiB
  • 包含游戏:
    • Among Us
    • Apex Legends
    • Fortnite
    • Forza Horizon
    • Free Fire
    • Genshin Impact
    • God of War
    • Minecraft
    • Roblox
    • Terraria
  • 每类图像数量: 1000
  • 图像尺寸: 640 x 360
  • 图像格式: .png
  • 数据集创建方式: 从YouTube上的著名游戏视频中每隔几秒保存一帧
  • 数据集上传时间: 2022年1月

数据集结构

数据实例

python

from datasets import load_dataset dataset = load_dataset("Bingsu/Gameplay_Images") DatasetDict({ train: Dataset({ features: [image, label], num_rows: 10000 }) })

python

dataset["train"].features {image: Image(decode=True, id=None), label: ClassLabel(num_classes=10, names=[Among Us, Apex Legends, Fortnite, Forza Horizon, Free Fire, Genshin Impact, God of War, Minecraft, Roblox, Terraria], id=None)}

数据字段

  • image: Image
    • 包含图像的 PIL.Image.Image 对象,尺寸为 640x360
    • 访问图像列时,图像文件会自动解码。解码大量图像文件可能需要较长时间,因此建议先查询样本索引再访问图像列。
  • label: 整数分类标签

类标签映射

json { "Among Us": 0, "Apex Legends": 1, "Fortnite": 2, "Forza Horizon": 3, "Free Fire": 4, "Genshin Impact": 5, "God of War": 6, "Minecraft": 7, "Roblox": 8, "Terraria": 9 }

数据分割

train
# of data 10000

训练测试分割

python

ds_new = dataset["train"].train_test_split(0.2, seed=42, stratify_by_column="label") ds_new DatasetDict({ train: Dataset({ features: [image, label], num_rows: 8000 }) test: Dataset({ features: [image, label], num_rows: 2000 }) })

搜集汇总
数据集介绍
main_image_url
构建方式
在电子游戏视觉识别研究领域,数据集的构建方法直接影响模型的泛化能力。本数据集通过系统化采集流程构建,从YouTube平台选取十款全球知名游戏的实况视频,采用固定间隔截取帧的方式,确保每款游戏获得一千张图像样本。所有图像均统一处理为640x360像素的PNG格式,以保持视觉一致性。数据采集工作于2022年1月完成,后续更新的游戏内容未被纳入,这为研究提供了明确的时间边界。
特点
该数据集在游戏图像分类任务中展现出鲜明的结构性特征。其包含《Among Us》《原神》《我的世界》等十款风格迥异的游戏类别,每类提供千张样本,形成均衡的万张图像集合。所有图像采用标准化尺寸与格式,有效减少预处理复杂度。数据标注体系采用整型标签映射机制,配合清晰的类别名称对应关系,为多分类研究提供可靠基础。图像内容源自真实游戏场景,涵盖界面元素、角色动作与环境交互等多维度视觉信息。
使用方法
基于深度学习框架的图像分类研究,可通过HuggingFace数据集库直接加载本资源。使用load_dataset函数调用后,可获得包含图像张量与分类标签的数据结构。研究者可利用内置的train_test_split方法,按需划分训练集与测试集,建议通过分层抽样保持类别分布均衡。数据访问时应注意查询顺序,优先索引样本再调用图像列,以优化解码效率。该数据集适用于卷积神经网络训练、跨游戏视觉特征分析等计算机视觉任务。
背景与挑战
背景概述
随着电子游戏产业的蓬勃发展,游戏内容识别与分析逐渐成为计算机视觉领域的重要研究方向。Bingsu/Gameplay_Images数据集于2022年1月由Kaggle平台用户Adit Magotra构建并发布,旨在为游戏图像分类任务提供标准化数据资源。该数据集涵盖了《Among Us》、《Apex Legends》等十款全球知名游戏的实时画面截图,每类包含1000张分辨率统一的图像,总计万张样本。其核心研究问题聚焦于通过游戏画面特征实现精准的游戏类型识别,为游戏内容审核、玩家行为分析及跨媒体检索等应用场景提供关键技术支撑,推动了娱乐计算与视觉智能的交叉融合。
当前挑战
在游戏图像分类领域,主要挑战在于游戏画面常包含动态光影、复杂界面叠加及艺术风格多样性,导致类内差异显著而类间边界模糊。例如,《Fortnite》与《Apex Legends》同为战术竞技游戏,其视觉特征高度相似,传统分类模型易产生混淆。数据集构建过程中,从YouTube游戏实况视频中按固定间隔抽取帧图像,面临画面质量参差不齐、界面元素(如血条、地图)遮挡主体内容,以及游戏版本更新导致的画面特征漂移等难题。此外,数据采集截止于2022年初,未能涵盖后续游戏内容迭代,可能影响模型在动态演变场景中的泛化能力。
常用场景
经典使用场景
在计算机视觉与游戏分析领域,Gameplay_Images数据集为图像分类任务提供了标准化的基准测试平台。该数据集汇集了十款全球知名电子游戏的画面截图,每类包含一千张统一尺寸的图像,其结构化的标注方式使得研究人员能够便捷地训练和评估卷积神经网络等深度学习模型。通过从YouTube游戏实况视频中定期截取帧,数据集捕捉了游戏画面的视觉多样性,为模型在复杂游戏场景下的泛化能力提供了验证基础。
实际应用
在产业应用层面,Gameplay_Images数据集为游戏内容审核、直播平台智能标签生成以及玩家行为分析提供了技术支撑。基于该数据集训练的模型能够自动识别直播流中的游戏类型,辅助平台实现内容分类与推荐;同时也可用于监测违规游戏画面,提升内容管理效率。此外,在游戏开发与测试中,此类视觉识别技术有助于分析玩家偏好与游戏界面设计效果,为产品优化提供数据洞察。
衍生相关工作
围绕该数据集,学术界衍生出多项经典研究工作,包括基于深度残差网络的游戏画面多分类模型、结合注意力机制的跨游戏特征提取框架,以及利用生成对抗网络进行游戏风格迁移的探索。部分研究进一步将数据集与元学习结合,实现了小样本场景下的快速游戏识别;另有工作拓展至视频时序分析,从连续帧中挖掘游戏状态转换模式,为游戏理解任务开辟了新的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作