ChronoPlay-QA
收藏Hugging Face2025-10-28 更新2025-10-29 收录
下载链接:
https://huggingface.co/datasets/leoner24/ChronoPlay-QA
下载链接
链接失效反馈官方服务:
资源简介:
Gaming RAG QA and Corpus Dataset是一个专门为评估检索增强生成(RAG)模型设计的基准数据集。它包含两个主要组成部分:问题-答案对(QA Pairs)和知识语料库(Knowledge Corpus)。问题-答案对专注于三款视频游戏,提供了232个高质量的问题-答案实例。知识语料库则包含了4192个文本片段,作为答案和上下文的来源。
创建时间:
2025-10-21
原始信息汇总
Gaming RAG QA and Corpus Dataset 概述
数据集基本信息
- 许可证: other
- 标签: rag, retrieval-augmented-generation, question-answering, gaming, dune, dyinglight2, pubgm
- 正式名称: Gaming RAG QA and Corpus Dataset
数据集描述
本数据集是为评估检索增强生成(RAG)模型而设计的基准数据集,包含两个主要组件:
- QA对:232个高质量问答对,涵盖三款视频游戏:
dune(Dune: Awakening)dyinglight2(Dying Light 2)pubgm(PUBG Mobile)
- 知识语料库:包含4192个文本文档/片段的完整知识库
支持任务
- 检索增强生成(RAG)
- 信息检索
- 忠实性/归因评估
- 问答系统
问题复杂度分类
- 比较性问答
- 基于提取的问答
- 多跳推理问答
数据集结构
QA对配置(qa_pairs)
数据字段:
game_name:游戏名称question:用户查询answer:真实答案references:验证答案的参考片段retrieved_docs:检索到的文档上下文question_topic:问题类别task_type:所需推理类型time:数据收集时间戳entities:关键实体列表
知识语料库配置(corpus)
数据字段:
game_name:游戏名称id:文档块唯一标识符title:源文档标题contents:文档文本内容segment_id:片段IDentities:关键实体列表extracted_date:信息提取日期
数据集创建
- 知识语料库从公共来源编译,包括官方游戏维基和补丁说明
- 问答对使用论文提出的方法合成生成
- 所有数据经过严格的手动检查和优化过程
引用信息
bibtex @article{he2025chronoplay, title={ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks}, author={He, Liyang and Zhang, Yuren and Zhu, Ziwei and Li, Zhenghui and Tong, Shiwei}, journal={arXiv preprint arXiv:2510.18455}, year={2025} }
搜集汇总
数据集介绍

构建方式
在游戏信息检索领域,ChronoPlay-QA数据集的构建采用了系统化的双模块架构。其知识语料库通过整合《沙丘:觉醒》《消逝的光芒2》及《绝地求生手游》的官方资料与社区文档,形成了包含4192个文本片段的权威知识基底。问答对部分则基于论文提出的合成生成框架,通过模拟真实玩家交互场景构建了232组高质量数据,并经过严格的人工校验流程确保答案的准确性与上下文相关性。
使用方法
研究者可分别加载知识语料库与问答对配置开展递进式实验。利用语料库构建检索系统的目标知识空间后,将问答对中的检索文档作为上下文输入,通过对比生成答案与标准答案的语义一致性评估模型性能。其特有的引用字段设计支持对生成内容进行细粒度的事实溯源验证,为检索增强生成系统的可信度研究提供了标准化测试环境。
背景与挑战
背景概述
随着检索增强生成技术在自然语言处理领域的兴起,游戏产业亟需能够处理复杂玩家查询的智能系统。ChronoPlay-QA数据集由研究团队于2025年提出,作为《ChronoPlay:游戏RAG基准中双重动态性与真实性的建模框架》的核心成果,聚焦于《沙丘:觉醒》《消逝的光芒2》和《绝地求生移动版》三款游戏。该数据集通过构建包含232组问答对与4192个知识文档的基准测试集,旨在解决游戏领域RAG系统在理解多类型玩家查询时的核心问题,为评估模型在游戏机制解析、剧情理解及技术问题解答等方面的能力提供了标准化工具。
当前挑战
在游戏问答领域,RAG系统需应对玩家查询的多样性与动态性挑战,包括跨游戏比较、多跳推理等复杂问题类型。数据集构建过程中面临双重挑战:其一是知识库的时效性维护,游戏版本更新导致机制变更需持续同步;其二是高质量问答对的生成与验证,需通过人工校验确保合成数据与真实玩家语境的契合度,同时保持答案在碎片化游戏知识文档中的准确溯源。
常用场景
经典使用场景
在游戏智能问答系统研究中,ChronoPlay-QA数据集为检索增强生成模型提供了标准化的评估基准。该数据集通过涵盖《沙丘:觉醒》《消逝的光芒2》《绝地求生手游》三款游戏的232组问答对,模拟真实玩家对游戏机制、技术支持和背景设定的多元查询场景。其知识库包含4192个文本片段,支持从基础信息提取到多跳推理的复杂任务验证,成为衡量模型在动态游戏环境中理解与生成能力的重要工具。
解决学术问题
该数据集有效解决了游戏领域RAG模型评估中真实性缺失与动态适应性不足的学术难题。通过构建包含时间戳标注的语料库与人工校验的问答对,研究者可量化分析模型对游戏版本更新内容的追踪能力。其细分的任务类型(如比较型问答、多跳推理)为探索模型在复杂语义理解、事实归因验证等关键问题提供了结构化实验基础,推动了开放域问答系统在动态知识场景下的理论创新。
实际应用
面向游戏产业智能化升级需求,该数据集支撑的RAG技术可应用于玩家支持系统与游戏内容管理。通过解析玩家自然语言提问,系统能即时调取官方文档、版本更新日志等结构化知识,生成精准的游戏机制说明或故障解决方案。这种技术不仅能降低人工客服成本,还可通过持续学习游戏内容迭代,为玩家提供与时俱进的个性化指导,提升游戏社群的交互体验。
数据集最近研究
最新研究方向
在游戏信息检索与生成领域,ChronoPlay-QA数据集聚焦于评估检索增强生成系统的双重动态性与真实性建模能力。该数据集通过涵盖《沙丘:觉醒》《消逝的光芒2》《绝地求生手游》三款游戏的多维度问答对与知识库,推动了对复杂推理任务的研究,包括比较性问答、多跳推理等前沿方向。其精确的参考片段标注机制为生成答案的可验证性研究提供了重要支撑,相关成果正逐步应用于游戏智能助手开发与动态知识更新系统的优化实践中。
以上内容由遇见数据集搜集并总结生成



