five

werewolf_game_reasoning|狼人杀数据集|游戏推理数据集

收藏
huggingface2025-03-18 更新2025-03-19 收录
狼人杀
游戏推理
下载链接:
https://huggingface.co/datasets/ReneeYe/werewolf_game_reasoning
下载链接
链接失效反馈
资源简介:
这是一个关于狼人杀游戏的数据集,包含了原始游戏数据和经过处理的多级指令数据集。数据集涵盖中文和英文两种语言,提供了游戏的行为记录和思考过程数据。原始数据包括事件记录和笔记,处理后的数据集分为基本游戏理解、高级游戏技巧和真实游戏行为三种类型,适用于监督微调(SFT)。
创建时间:
2025-03-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于狼人杀游戏的原始记录和专家生成的思考过程数据。原始数据包括游戏中的夜间行动、白天发言、投票记录以及游戏回顾,同时涵盖了玩家的思考过程,如发言总结、投票理由和未来策略。通过Claude-3.5-Sonnet-V2模型自动翻译,生成了中英双语版本。在此基础上,结合书籍和网络信息,进一步构建了用于监督微调的多层次指令数据集,涵盖了基础游戏理解、高级游戏技巧和真实游戏行为。
特点
该数据集的特点在于其多层次的结构设计,涵盖了从基础术语解释到高级策略指导的全面内容。数据集不仅包含游戏行为的详细记录,还通过‘思考-响应’格式模拟真实游戏场景,并引入了角色预测任务,增强了数据集的实用性和挑战性。此外,数据集支持中英双语,便于跨语言研究和应用。其丰富的元数据和统计信息也为进一步的分析和模型训练提供了便利。
使用方法
使用该数据集时,首先需通过提供的处理脚本对原始数据进行预处理。用户可通过指定路径、语言和保存路径等参数,生成不同格式的数据文件,包括CSV和Parquet格式。数据集适用于文本生成任务,特别是与游戏策略和角色推理相关的模型训练。用户可根据需求选择是否添加角色预测任务,并通过配置文件了解数据的统计信息。该数据集为研究多智能体交互和语言模型在游戏场景中的应用提供了丰富的实验素材。
背景与挑战
背景概述
Werewolf Game Reasoning数据集由Rong Ye等研究人员于2025年创建,旨在支持多智能体语言模型在语言游戏中的战略交互研究。该数据集基于《Multi-agent KTO: Reinforcing Strategic Interactions of Large Language Model in Language Game》论文的研究需求,涵盖了狼人杀游戏的原始数据和多层次的指令数据集。数据集包含中文和英文版本,分别由专家生成和Claude-3.5-Sonnet-V2模型自动翻译。其核心研究问题在于如何通过游戏行为数据(如行动、发言和投票)来训练和评估语言模型在复杂社交推理任务中的表现。该数据集为语言模型在游戏策略、角色推理和多轮对话中的能力提供了重要的研究基础。
当前挑战
Werewolf Game Reasoning数据集在构建和应用中面临多重挑战。首先,狼人杀游戏的复杂社交推理和策略交互对语言模型的推理能力提出了极高要求,如何准确捕捉玩家的思维过程并将其转化为可训练的指令数据是一个关键难题。其次,数据集的构建过程中,原始数据的多语言翻译和一致性处理面临挑战,尤其是自动翻译可能导致语义丢失或偏差。此外,游戏行为数据的结构化处理(如行动、发言和投票的分类与标注)需要大量的人工干预和验证,以确保数据的准确性和可用性。最后,如何将游戏策略和术语的抽象概念转化为具体的训练任务,也是数据集构建中的一大挑战。
常用场景
经典使用场景
在自然语言处理领域,werewolf_game_reasoning数据集被广泛应用于训练和评估多智能体对话系统。通过模拟狼人杀游戏中的复杂对话和决策过程,该数据集为研究者提供了一个理想的平台,用于测试模型在多人互动场景中的推理能力和策略生成能力。特别是在角色扮演和策略推理任务中,数据集中的多层次指令和真实游戏行为数据能够有效提升模型的对话生成质量。
实际应用
在实际应用中,werewolf_game_reasoning数据集被广泛用于开发智能游戏助手和社交机器人。通过模拟狼人杀游戏中的复杂对话和决策过程,该数据集能够帮助开发者训练出能够在多人互动场景中表现出色的智能体。这些智能体不仅可以应用于游戏领域,还可以扩展到其他需要复杂社交推理的应用场景,如在线客服和虚拟社交平台。
衍生相关工作
基于werewolf_game_reasoning数据集,研究者们开发了一系列经典的多智能体对话系统和策略推理模型。例如,Multi-agent KTO模型通过强化学习技术,显著提升了模型在狼人杀游戏中的策略生成能力。此外,该数据集还催生了许多关于角色推理和对话生成的研究工作,为多智能体系统的进一步发展提供了重要的理论基础和实践经验。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Kaggle Stock Market Data

该数据集包含多个股票市场的历史数据,涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等信息。数据集还包括了股票的代码、日期和市场名称等基本信息。

www.kaggle.com 收录