werewolf_game_reasoning
收藏Hugging Face2025-03-18 更新2025-03-19 收录
下载链接:
https://huggingface.co/datasets/ReneeYe/werewolf_game_reasoning
下载链接
链接失效反馈资源简介:
这是一个关于狼人杀游戏的数据集,包含了原始游戏数据和经过处理的多级指令数据集。数据集涵盖中文和英文两种语言,提供了游戏的行为记录和思考过程数据。原始数据包括事件记录和笔记,处理后的数据集分为基本游戏理解、高级游戏技巧和真实游戏行为三种类型,适用于监督微调(SFT)。
This is a dataset for the Werewolf game, which contains raw game data and processed multi-level instruction datasets. The dataset covers both Chinese and English languages, and provides game behavior records and thinking process data. The raw data includes event logs and notes, while the processed dataset is divided into three categories: basic game comprehension, advanced game tactics, and real in-game behaviors, which is suitable for Supervised Fine-tuning (SFT).
创建时间:
2025-03-17
AI搜集汇总
数据集介绍

构建方式
该数据集的构建基于狼人杀游戏的原始记录和专家生成的思考过程数据。原始数据包括游戏中的夜间行动、白天发言、投票记录以及游戏回顾,同时涵盖了玩家的思考过程,如发言总结、投票理由和未来策略。通过Claude-3.5-Sonnet-V2模型自动翻译,生成了中英双语版本。在此基础上,结合书籍和网络信息,进一步构建了用于监督微调的多层次指令数据集,涵盖了基础游戏理解、高级游戏技巧和真实游戏行为。
特点
该数据集的特点在于其多层次的结构设计,涵盖了从基础术语解释到高级策略指导的全面内容。数据集不仅包含游戏行为的详细记录,还通过‘思考-响应’格式模拟真实游戏场景,并引入了角色预测任务,增强了数据集的实用性和挑战性。此外,数据集支持中英双语,便于跨语言研究和应用。其丰富的元数据和统计信息也为进一步的分析和模型训练提供了便利。
使用方法
使用该数据集时,首先需通过提供的处理脚本对原始数据进行预处理。用户可通过指定路径、语言和保存路径等参数,生成不同格式的数据文件,包括CSV和Parquet格式。数据集适用于文本生成任务,特别是与游戏策略和角色推理相关的模型训练。用户可根据需求选择是否添加角色预测任务,并通过配置文件了解数据的统计信息。该数据集为研究多智能体交互和语言模型在游戏场景中的应用提供了丰富的实验素材。
背景与挑战
背景概述
Werewolf Game Reasoning数据集由Rong Ye等研究人员于2025年创建,旨在支持多智能体语言模型在语言游戏中的战略交互研究。该数据集基于《Multi-agent KTO: Reinforcing Strategic Interactions of Large Language Model in Language Game》论文的研究需求,涵盖了狼人杀游戏的原始数据和多层次的指令数据集。数据集包含中文和英文版本,分别由专家生成和Claude-3.5-Sonnet-V2模型自动翻译。其核心研究问题在于如何通过游戏行为数据(如行动、发言和投票)来训练和评估语言模型在复杂社交推理任务中的表现。该数据集为语言模型在游戏策略、角色推理和多轮对话中的能力提供了重要的研究基础。
当前挑战
Werewolf Game Reasoning数据集在构建和应用中面临多重挑战。首先,狼人杀游戏的复杂社交推理和策略交互对语言模型的推理能力提出了极高要求,如何准确捕捉玩家的思维过程并将其转化为可训练的指令数据是一个关键难题。其次,数据集的构建过程中,原始数据的多语言翻译和一致性处理面临挑战,尤其是自动翻译可能导致语义丢失或偏差。此外,游戏行为数据的结构化处理(如行动、发言和投票的分类与标注)需要大量的人工干预和验证,以确保数据的准确性和可用性。最后,如何将游戏策略和术语的抽象概念转化为具体的训练任务,也是数据集构建中的一大挑战。
常用场景
经典使用场景
在自然语言处理领域,werewolf_game_reasoning数据集被广泛应用于训练和评估多智能体对话系统。通过模拟狼人杀游戏中的复杂对话和决策过程,该数据集为研究者提供了一个理想的平台,用于测试模型在多人互动场景中的推理能力和策略生成能力。特别是在角色扮演和策略推理任务中,数据集中的多层次指令和真实游戏行为数据能够有效提升模型的对话生成质量。
实际应用
在实际应用中,werewolf_game_reasoning数据集被广泛用于开发智能游戏助手和社交机器人。通过模拟狼人杀游戏中的复杂对话和决策过程,该数据集能够帮助开发者训练出能够在多人互动场景中表现出色的智能体。这些智能体不仅可以应用于游戏领域,还可以扩展到其他需要复杂社交推理的应用场景,如在线客服和虚拟社交平台。
衍生相关工作
基于werewolf_game_reasoning数据集,研究者们开发了一系列经典的多智能体对话系统和策略推理模型。例如,Multi-agent KTO模型通过强化学习技术,显著提升了模型在狼人杀游戏中的策略生成能力。此外,该数据集还催生了许多关于角色推理和对话生成的研究工作,为多智能体系统的进一步发展提供了重要的理论基础和实践经验。
以上内容由AI搜集并总结生成



