MindGamesArena-Codenames-Dataset-2-0

Hugging Face2025-08-02 更新2025-08-03 收录

下载链接：

https://huggingface.co/datasets/Mithilss/MindGamesArena-Codenames-Dataset-2-0

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了游戏中的交互信息，具体字段包括观测到的信息、采取的动作、玩家ID、角色、执行动作的原因、游戏消息板内容、提示信息中的内容和角色、游戏ID以及当前的回合数。数据集仅包含训练集部分。

创建时间：

2025-08-01

原始信息汇总

MindGamesArena-Codenames-Dataset-2-0 数据集概述

数据集基本信息

数据集名称: MindGamesArena-Codenames-Dataset-2-0
存储位置: https://huggingface.co/datasets/Mithilss/MindGamesArena-Codenames-Dataset-2-0
下载大小: 24,344,424 字节
数据集大小: 276,281,097 字节

数据特征

observations: 字符串类型，记录观察内容
actions: 字符串类型，记录行动内容
pid: int64类型，记录参与者ID
role: 字符串类型，记录角色信息
reason: 字符串类型，记录原因
board: 字符串序列的序列，记录棋盘信息
prompt: 列表类型，包含以下字段：
- content: 字符串类型
- role: 字符串类型
game_id: 字符串类型，记录游戏ID
turn_count: int64类型，记录回合数

数据划分

train:
- 样本数量: 42,585
- 字节大小: 276,281,097

配置文件

config_name: default
- 数据文件:
  - split: train
  - path: data/train-*

搜集汇总

数据集介绍

构建方式

MindGamesArena-Codenames-Dataset-2-0数据集通过精心设计的实验流程构建，采集了多轮次、多角色的游戏交互数据。研究团队采用标准化的数据采集协议，记录了玩家在Codenames游戏中的观察、行动、角色分配及推理过程，确保数据覆盖游戏全周期的决策链条。每个样本包含游戏板状态、玩家提示、行动序列等结构化字段，并通过唯一标识符实现跨轮次数据关联。

特点

该数据集以多模态交互为核心特征，完整呈现了语言推理与策略决策的耦合关系。其特色在于细粒度的角色标注（如提示者/猜词者）与思维链记录（reason字段），为研究心智理论提供了独特视角。高达42,585条样本的规模覆盖了丰富的词汇组合与游戏情境，board字段的序列化表示则保留了游戏状态的动态演变过程。

使用方法

使用者可通过加载标准化的训练集拆分（train split）开展多任务学习，各字段天然支持意图识别、策略预测等下游任务。prompt字段中的角色对话适用于语言模型微调，而turn_count与game_id支持时序分析与跨游戏对比。建议结合board状态序列与actions字段重构决策树，或利用reason字段进行认知行为建模。

背景与挑战

背景概述

MindGamesArena-Codenames-Dataset-2-0是由MindGames Arena团队开发的一个专注于语言推理与策略交互的数据集，旨在支持自然语言处理与多智能体协作的研究。该数据集基于经典桌游Codenames的游戏机制，记录了玩家在游戏中的观察、决策过程及互动行为，为研究人类与AI在复杂语言环境下的协作与竞争提供了宝贵资源。其核心研究问题聚焦于如何通过自然语言理解与生成技术提升智能体在策略性对话环境中的表现。该数据集的推出填补了语言推理与多智能体交互研究领域的空白，对推动对话系统与认知计算的发展具有重要意义。

当前挑战

MindGamesArena-Codenames-Dataset-2-0面临的挑战主要体现在两个方面：领域问题层面，该数据集需解决如何在多轮对话中准确捕捉语言隐含的复杂策略意图，这对自然语言理解的深度与广度提出了极高要求；数据构建层面，游戏过程中的动态交互与上下文依赖关系增加了数据标注与清洗的难度，如何确保数据的一致性与完整性成为关键挑战。此外，游戏角色的多样性与决策逻辑的多样性进一步加剧了数据建模的复杂性，要求研究者设计更精细的算法以应对多维度推理任务。

常用场景

经典使用场景

在自然语言处理与多智能体协作研究领域，MindGamesArena-Codenames-Dataset-2-0为分析语义推理与策略决策提供了标准化实验环境。该数据集通过记录玩家在Codenames桌游中的语言交互、行动序列及推理过程，成为测试智能体上下文理解与协作能力的基准平台，尤其适用于研究多轮对话中的意图传递与团队协作机制。

解决学术问题

该数据集有效解决了多智能体系统中语义对齐与策略协调的核心挑战。通过提供真实游戏场景下的语言行为标注数据，支持了隐式推理建模、知识共享机制等研究方向，为验证零样本协作算法的鲁棒性提供了量化依据，显著推进了人机混合团队决策领域的理论发展。

衍生相关工作

基于该数据集衍生的经典研究包括《Codenames as a Benchmark for Human-Agent Collaboration》等系列论文，这些工作构建了游戏化评估框架。后续研究进一步扩展至跨文化交际分析领域，形成了语言策略迁移学习的创新方法论体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集