The Undergraduate Games Corpus

github2022-04-14 更新2024-05-31 收录

下载链接：

https://github.com/barrettrees/undergraduate_games_corpus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了数百名本科生的作品，这些作品被用于加速技术游戏研究。数据集中的所有数据和元数据都是在获得知情同意后收集的，元数据如游戏标题、描述和标签由学生作者直接提供。数据集用于机器感知交互媒体的机器学习研究。

This dataset comprises works created by hundreds of undergraduate students, and is employed to advance technical game research. All data and metadata within this dataset were collected with informed consent. Metadata including game titles, descriptions and tags were directly provided by the student authors. This dataset is intended for machine learning research focused on machine-perceived interactive media.

创建时间：

2021-02-08

原始信息汇总

数据集概述

数据集名称

The Undergraduate Games Corpus: A Dataset for Machine Perception of Interactive Media

数据集描述

该数据集包含数百名本科生的作品，这些学生选择将其作品纳入用于加速技术游戏研究的资料库中。数据及元数据均在获得知情同意后收集。游戏描述（如标题、描述和标签）由学生作者直接提供，未经外部评审验证。

数据集内容

数据文件：corpus.json
数据结构：JSON对象，键为全局唯一归档资源键（ARKs），值为描述游戏的对象，包含以下字段：
- permalink
- title
- description
- authors
- engine
- tags
- license
- year
- quarter
- files

数据集使用示例

参见ExampleUsage.ipynb，该笔记本展示了如何加载、过滤数据集，并下载解析数据集中包含的Twine游戏内容。

数据集引用

@inproceedings{anderson2021undergraduate, title={The Undergraduate Games Corpus: A Dataset for Machine Perception of Interactive Media}, author={Anderson, Barrett R and Smith, Adam M}, booktitle={Proceedings of the Thirty-Fifth AAAI Conference on Artificial Intelligence (AAAI-21)}, year={2021} }

数据集联系人

Barrett Anderson (barander@ucsc.edu)
Adam Smith (amsmith@ucsc.edu)

搜集汇总

数据集介绍

构建方式

The Undergraduate Games Corpus 数据集的构建基于数百名本科生的自愿贡献，这些学生在知情同意的前提下，选择将其作品纳入数据集，以推动交互媒体技术研究的发展。数据收集过程中，学生作者直接提供了游戏的元数据，如标题、描述和标签等，且这些数据未经外部评审。为确保数据的合法性和伦理性，数据集在发布后还根据学生的请求进行了调整，并新增了一部分课程作品。

特点

该数据集的特点在于其独特的来源和丰富的元数据信息。所有游戏作品均由本科生创作，涵盖了多样化的主题和风格。元数据包括游戏的标题、描述、作者、引擎、标签、许可信息、年份、季度以及相关文件的下载链接。这些信息为研究者提供了全面的背景资料，便于深入分析游戏的设计和内容。此外，数据集还特别强调了数据的伦理使用，确保所有贡献者的知情同意。

使用方法

使用 The Undergraduate Games Corpus 数据集时，研究者可以通过 `corpus.json` 文件访问游戏的元数据，该文件以 JSON 格式存储，包含全局唯一的归档资源键（ARK）及其对应的游戏描述信息。数据集的使用示例可在 `ExampleUsage.ipynb` 中找到，该笔记本展示了如何加载和过滤数据集，并解析其中的 Twine 游戏内容。为方便快速上手，数据集还提供了 Binder 链接，用户可直接在云端环境中运行示例代码。

背景与挑战

背景概述

The Undergraduate Games Corpus 数据集由 Barrett R. Anderson 和 Adam M. Smith 于2021年创建，旨在为机器感知交互媒体提供研究基础。该数据集收录了数百名本科生的游戏作品，这些作品经过学生同意后被纳入数据集，以推动技术游戏研究的发展。数据集的核心研究问题在于如何通过机器学习和人工智能技术，对交互媒体内容进行感知与分析。该数据集的发布在AAAI-21会议上，为游戏研究领域提供了宝贵的资源，尤其是在游戏内容自动分类、情感分析以及游戏设计模式识别等方面具有重要影响力。

当前挑战

The Undergraduate Games Corpus 数据集在构建和应用过程中面临多重挑战。首先，数据集的构建依赖于学生的自愿参与，且需确保所有数据收集过程符合伦理规范，这增加了数据获取的复杂性和时间成本。其次，由于游戏作品的多样性和复杂性，如何有效地对游戏内容进行元数据标注和分类成为一大难题。此外，数据集中包含的游戏文件分布在不同的存储平台上，数据的一致性和完整性难以保证。最后，如何在保护学生隐私的前提下，最大化数据集的科研价值，也是研究者需要权衡的重要问题。

常用场景

经典使用场景

The Undergraduate Games Corpus数据集在机器感知互动媒体的研究中扮演了关键角色。该数据集通过收集数百名本科生的游戏作品，为研究人员提供了一个丰富的资源库，用于分析和理解游戏设计中的模式与趋势。特别是在自然语言处理和机器学习领域，该数据集被广泛用于训练模型以识别和分类游戏内容，从而推动游戏推荐系统和内容生成技术的发展。

实际应用

在实际应用中，The Undergraduate Games Corpus数据集被广泛用于游戏产业的多个方面。例如，游戏开发公司可以利用该数据集中的游戏内容和元数据，训练机器学习模型以自动生成游戏关卡或推荐个性化游戏内容。此外，教育机构也可以利用该数据集进行游戏设计课程的教学和研究，帮助学生更好地理解游戏设计的理论与实践。

衍生相关工作

基于The Undergraduate Games Corpus数据集，已经衍生出多项经典研究工作。例如，有研究利用该数据集开发了基于深度学习的游戏内容生成模型，能够自动生成符合特定风格的游戏关卡。此外，还有研究利用该数据集中的元数据，开发了基于语义的游戏推荐系统，能够根据玩家的偏好推荐个性化的游戏内容。这些研究不仅推动了游戏设计领域的技术进步，也为机器感知互动媒体的研究提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集