ChronoPlay-QA

Hugging Face2025-10-28 更新2025-10-29 收录

下载链接：

https://huggingface.co/datasets/leoner24/ChronoPlay-QA

下载链接

链接失效反馈

官方服务：

资源简介：

Gaming RAG QA and Corpus Dataset是一个专门为评估检索增强生成(RAG)模型设计的基准数据集。它包含两个主要组成部分：问题-答案对(QA Pairs)和知识语料库(Knowledge Corpus)。问题-答案对专注于三款视频游戏，提供了232个高质量的问题-答案实例。知识语料库则包含了4192个文本片段，作为答案和上下文的来源。

创建时间：

2025-10-21

原始信息汇总

Gaming RAG QA and Corpus Dataset 概述

数据集基本信息

许可证: other
标签: rag, retrieval-augmented-generation, question-answering, gaming, dune, dyinglight2, pubgm
正式名称: Gaming RAG QA and Corpus Dataset

数据集描述

本数据集是为评估检索增强生成（RAG）模型而设计的基准数据集，包含两个主要组件：

QA对：232个高质量问答对，涵盖三款视频游戏：
- dune（Dune: Awakening）
- dyinglight2（Dying Light 2）
- pubgm（PUBG Mobile）
知识语料库：包含4192个文本文档/片段的完整知识库

支持任务

检索增强生成（RAG）
信息检索
忠实性/归因评估
问答系统

问题复杂度分类

比较性问答
基于提取的问答
多跳推理问答

数据集结构

QA对配置（qa_pairs）

数据字段：

game_name：游戏名称
question：用户查询
answer：真实答案
references：验证答案的参考片段
retrieved_docs：检索到的文档上下文
question_topic：问题类别
task_type：所需推理类型
time：数据收集时间戳
entities：关键实体列表

知识语料库配置（corpus）

数据字段：

game_name：游戏名称
id：文档块唯一标识符
title：源文档标题
contents：文档文本内容
segment_id：片段ID
entities：关键实体列表
extracted_date：信息提取日期

数据集创建

知识语料库从公共来源编译，包括官方游戏维基和补丁说明
问答对使用论文提出的方法合成生成
所有数据经过严格的手动检查和优化过程

引用信息

bibtex @article{he2025chronoplay, title={ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks}, author={He, Liyang and Zhang, Yuren and Zhu, Ziwei and Li, Zhenghui and Tong, Shiwei}, journal={arXiv preprint arXiv:2510.18455}, year={2025} }

搜集汇总

数据集介绍

构建方式

在游戏信息检索领域，ChronoPlay-QA数据集的构建采用了系统化的双模块架构。其知识语料库通过整合《沙丘：觉醒》《消逝的光芒2》及《绝地求生手游》的官方资料与社区文档，形成了包含4192个文本片段的权威知识基底。问答对部分则基于论文提出的合成生成框架，通过模拟真实玩家交互场景构建了232组高质量数据，并经过严格的人工校验流程确保答案的准确性与上下文相关性。

使用方法

研究者可分别加载知识语料库与问答对配置开展递进式实验。利用语料库构建检索系统的目标知识空间后，将问答对中的检索文档作为上下文输入，通过对比生成答案与标准答案的语义一致性评估模型性能。其特有的引用字段设计支持对生成内容进行细粒度的事实溯源验证，为检索增强生成系统的可信度研究提供了标准化测试环境。

背景与挑战

背景概述

随着检索增强生成技术在自然语言处理领域的兴起，游戏产业亟需能够处理复杂玩家查询的智能系统。ChronoPlay-QA数据集由研究团队于2025年提出，作为《ChronoPlay：游戏RAG基准中双重动态性与真实性的建模框架》的核心成果，聚焦于《沙丘：觉醒》《消逝的光芒2》和《绝地求生移动版》三款游戏。该数据集通过构建包含232组问答对与4192个知识文档的基准测试集，旨在解决游戏领域RAG系统在理解多类型玩家查询时的核心问题，为评估模型在游戏机制解析、剧情理解及技术问题解答等方面的能力提供了标准化工具。

当前挑战

在游戏问答领域，RAG系统需应对玩家查询的多样性与动态性挑战，包括跨游戏比较、多跳推理等复杂问题类型。数据集构建过程中面临双重挑战：其一是知识库的时效性维护，游戏版本更新导致机制变更需持续同步；其二是高质量问答对的生成与验证，需通过人工校验确保合成数据与真实玩家语境的契合度，同时保持答案在碎片化游戏知识文档中的准确溯源。

常用场景

经典使用场景

在游戏智能问答系统研究中，ChronoPlay-QA数据集为检索增强生成模型提供了标准化的评估基准。该数据集通过涵盖《沙丘：觉醒》《消逝的光芒2》《绝地求生手游》三款游戏的232组问答对，模拟真实玩家对游戏机制、技术支持和背景设定的多元查询场景。其知识库包含4192个文本片段，支持从基础信息提取到多跳推理的复杂任务验证，成为衡量模型在动态游戏环境中理解与生成能力的重要工具。

解决学术问题

该数据集有效解决了游戏领域RAG模型评估中真实性缺失与动态适应性不足的学术难题。通过构建包含时间戳标注的语料库与人工校验的问答对，研究者可量化分析模型对游戏版本更新内容的追踪能力。其细分的任务类型（如比较型问答、多跳推理）为探索模型在复杂语义理解、事实归因验证等关键问题提供了结构化实验基础，推动了开放域问答系统在动态知识场景下的理论创新。

实际应用

面向游戏产业智能化升级需求，该数据集支撑的RAG技术可应用于玩家支持系统与游戏内容管理。通过解析玩家自然语言提问，系统能即时调取官方文档、版本更新日志等结构化知识，生成精准的游戏机制说明或故障解决方案。这种技术不仅能降低人工客服成本，还可通过持续学习游戏内容迭代，为玩家提供与时俱进的个性化指导，提升游戏社群的交互体验。

数据集最近研究