gamemasterai

Hugging Face2025-08-02 更新2025-08-03 收录

下载链接：

https://huggingface.co/datasets/Idrinth/gamemasterai

下载链接

链接失效反馈

官方服务：

资源简介：

Gamemaster AI是一个人工创建的微调数据集，旨在训练语言模型成为桌面角色扮演游戏（RPG）中的更好的游戏主持人。数据集由精心设计的提示-响应对组成，这些对演示了AI在单玩家角色扮演场景中应该如何响应玩家的行为和决策。数据集聚焦于训练模型担任叙述性游戏主持人、提供吸引人的故事进展和世界构建、恰当地响应玩家行为和决策以及保持一致的故事讲述和角色互动。

创建时间：

2025-08-02

原始信息汇总

Gamemaster AI 数据集概述

数据集基本信息

名称: Gamemaster AI
任务类别: 文本生成
语言: 英语
大小类别: n<1K
许可证: MIT
数据集大小: 8900字节
下载大小: 10965字节
训练样本数: 5

数据集描述

目的: 用于微调语言模型，使其成为更好的桌面角色扮演游戏（RPG）游戏主持人。
特点: 包含精心设计的提示-响应对，展示AI作为游戏主持人应如何响应单玩家角色扮演场景。

数据集结构

特征:
- messages: 对话轮次列表，包含content（消息文本）和role（用户/助手）
- text: 对话的格式化文本表示

数据集来源

存储库: https://github.com/bjoern-buettner/roleplay-ai

主要用途

微调语言模型以用于：
- 单人桌面RPG会话
- 交互式叙事应用
- 角色扮演游戏辅助工具

使用示例

python from datasets import load_dataset dataset = load_dataset("Idrinth/gamemasterai") train_data = dataset["train"] sample = train_data[0] for message in sample["messages"]: print(f"{message[role]}: {message[content]}")

局限性

小数据集: 目前仅包含5个训练样本
领域特定: 专注于RPG/奇幻场景
仅英语: 不支持多语言
早期阶段: 数据集正在积极扩展中

贡献

方式:
- 添加新的RPG场景示例
- 改进现有对话质量
- 建议其他用例
链接:
- GitHub存储库: https://github.com/bjoern-buettner/roleplay-ai
- Discord社区: https://discord.gg/idrinth

引用

bibtex @dataset{gamemaster_ai, title={Gamemaster AI Training Dataset}, author={Björn Büttner}, year={2025}, url={https://huggingface.co/datasets/Idrinth/gamemasterai} }

搜集汇总

数据集介绍

构建方式

在角色扮演游戏（RPG）领域，高质量的游戏主持（Game Master）对于沉浸式体验至关重要。GameMasterAI数据集通过人工精心构建，收录了针对单人角色扮演场景设计的提示-响应对。数据采集过程注重展示游戏主持应如何推动叙事发展、构建世界观，并对玩家行为做出合理反馈。每个训练样本均采用对话式结构，包含用户（玩家）和助手（游戏主持）的多轮交互信息，通过messages字段记录完整的对话流程，同时以text字段提供对话的格式化文本表示。

特点

作为专为训练AI游戏主持设计的语料库，该数据集展现出鲜明的领域特性。其核心价值在于精准模拟桌面角色扮演游戏中的主持场景，包含故事推进、世界观构建、角色互动等关键要素。数据样本经过严格筛选，确保游戏主持始终处于叙事者立场，避免角色混淆。值得注意的是，当前版本仅包含5个英文训练样本，虽然规模有限但质量精良，所有案例均围绕奇幻RPG场景设计，为模型微调提供了高度聚焦的领域数据。

使用方法

该数据集主要服务于语言模型在游戏主持场景中的微调任务。研究人员可通过Hugging Face的datasets库直接加载数据集，便捷获取训练样本。典型应用流程包括：加载数据集后访问train分割，遍历messages字段解析对话轮次，其中role标识发言者身份（user/assistant），content包含具体对话内容。开发者可将这些高质量的对话样本用于监督式微调，训练模型掌握游戏主持的应答模式。鉴于当前数据规模较小，建议结合数据增强技术或参与社区贡献以扩展训练样本的多样性。

背景与挑战

背景概述

GameMasterAI数据集由Björn Büttner于2025年创建，旨在为桌面角色扮演游戏（RPG）提供AI游戏主持人的训练数据。该数据集通过精心设计的提示-响应对，展示了AI在单人角色扮演场景中如何作为游戏主持人进行回应。其核心研究问题聚焦于提升语言模型在叙事构建、世界生成和角色互动方面的能力，以增强交互式故事讲述的沉浸感和连贯性。作为早期探索性工作，该数据集为数字D&D战役、单人冒险游戏等应用场景提供了基础支持，推动了AI在创意写作和互动小说开发领域的应用。

当前挑战

该数据集面临的主要挑战包括样本多样性不足和领域局限性。当前仅包含5个训练样本，难以覆盖RPG游戏中复杂多变的叙事场景和玩家决策分支。数据构建过程中需克服高质量对话标注的挑战，包括维持故事逻辑一致性、平衡开放性与引导性响应、以及模拟人类游戏主持人的临场应变能力。此外，单一英语语料和特定幻想主题的局限，也制约了模型在多语言和跨题材场景中的泛化性能。

常用场景

经典使用场景

在角色扮演游戏（RPG）领域，GameMasterAI数据集为训练语言模型提供了高质量的对话样本，使其能够模拟游戏主持人的行为。这些样本展示了如何根据玩家的行动和决策，生成连贯且引人入胜的叙事内容，从而提升单人或多人RPG体验的沉浸感。数据集特别适用于需要动态生成故事情节和角色互动的场景，为AI驱动的游戏主持提供了标准化训练素材。

解决学术问题

GameMasterAI数据集解决了自然语言生成在游戏领域的特定应用问题，尤其是如何让AI模型理解并模拟游戏主持人的叙事逻辑。通过提供精心设计的对话样本，该数据集帮助研究者探索模型在动态叙事生成、上下文一致性保持以及玩家行为响应方面的表现。其意义在于填补了游戏AI研究中高质量对话数据的空白，为后续研究提供了可复现的实验基础。

衍生相关工作

围绕GameMasterAI数据集，已有研究开始探索如何扩展其应用范围。例如，部分工作尝试将其与更大的语言模型结合，以生成更复杂的游戏叙事；另一些研究则专注于提升模型的上下文记忆能力，使其能处理长周期的玩家决策链。这些衍生工作进一步推动了AI在互动娱乐和创意生成领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集