five

c2c-ai-vs-ai

收藏
Hugging Face2026-04-23 更新2026-04-24 收录
下载链接:
https://huggingface.co/datasets/negotiation-games/c2c-ai-vs-ai
下载链接
链接失效反馈
官方服务:
资源简介:
C2C: Cooperate to Compete (AI vs AI Games) 数据集包含 972 场完整记录的 AI 对 AI 游戏,源自 Cooperate to Compete (C2C) 基准测试。这是一个基于四玩家征服游戏的长期、混合动机的多智能体谈判环境,具有私人区域目标、战争迷雾和非约束性廉价谈判。数据集按 6 种干预条件组织,每种条件包含 162 场匹配游戏,每场游戏都有相同的起始棋盘位置。每个游戏文件夹包含 manifest.json(游戏级元数据)、game_logs(逐回合引擎事件日志)、game_states(每个玩家回合的完整游戏状态快照)和 deal_summaries(每次谈判交易的结构化摘要)。数据集总大小约为 23 GB,使用了多种模型(如 openai/gpt-5.2、gemini/gemini-3.1-pro-preview 等)。数据集以嵌套 JSON 文件形式存储,需通过特定方法加载。适用于多智能体谈判、游戏理论和 AI 行为研究。

The C2C: Cooperate to Compete (AI vs AI Games) dataset contains 972 fully recorded AI vs AI games, derived from the Cooperate to Compete (C2C) benchmark. This is a long-term, mixed-motive multi-agent negotiation environment based on a four-player conquest game, featuring private area objectives, fog of war, and non-binding cheap talk. The dataset is organized into 6 intervention conditions, each containing 162 matched games with identical starting board positions. Each game folder includes manifest.json (game-level metadata), game_logs (turn-by-turn engine event logs), game_states (complete game state snapshots for each players turn), and deal_summaries (structured summaries of each negotiation deal). The total dataset size is approximately 23 GB, utilizing various models (e.g., openai/gpt-5.2, gemini/gemini-3.1-pro-preview, etc.). The dataset is stored in nested JSON files and requires specific methods for loading. It is suitable for research in multi-agent negotiation, game theory, and AI behavior.
创建时间:
2026-04-23
原始信息汇总

数据集概述:C2C: Cooperate to Compete — AI vs AI Games

基本信息

  • 数据集名称:C2C: Cooperate to Compete — AI vs AI Games
  • 许可证:CC-BY-4.0
  • 语言:英语
  • 标签:多智能体、谈判、博弈论、LLM智能体、欺骗、协调
  • 数据集大小:1,000 < 样本数 < 10,000
  • 总大小:约23 GB

数据集描述

该数据集包含 972 场完全记录的 AI 对 AI 游戏,源自 Cooperate to Compete (C2C) 基准测试。这是一个基于四玩家征服游戏的长时序、混合动机多智能体谈判环境,包含私有区域目标、战争迷雾和非约束性廉价谈判(cheap-talk negotiation)机制。

数据结构

数据集按 6 种干预条件 组织,每种条件包含 162 场匹配游戏(基于相同的起始棋盘位置):

文件夹名称 描述
baseline/ 标准提示——无干预
deceit_strategy/ 提示一个目标智能体欺骗对手
aggressive_ask_strategy/ 提示一个目标智能体更激进地谈判
support_strategy/ 提示一个目标智能体明确请求支援
one_partner_strategy/ 限制一个目标智能体仅与单一伙伴谈判
silent_no_negotiate/ 禁用目标智能体的所有谈判能力

每个策略文件夹包含 web_game_1/web_game_162/ 子文件夹。

单场游戏文件夹结构

每个 web_game_<idx>/ 文件夹包含:

  • manifest.json:游戏级元数据(模型、种子、胜者等)
  • game_logs/:逐回合引擎事件日志
  • game_states/:每个玩家回合的完整游戏状态快照(格式:turn_<T>_player_<P>/game_state.json
  • deal_summaries/:后处理的结构化交易摘要(交易文本、参与方、履行/违约情况)

Manifest 模式(每场游戏)

json { "game_id": "web_game_007", "game_index": 7, "human_player": null, "human_commander": "Commander Green", "survey_version": "4", "created_at": "20260316_163122", "seed": 3000, "board_seed": 3000, "shuffle_seed": 53000, "config_models": ["openai/gpt-5.2", "gemini/gemini-3.1-pro-preview", "xai/grok-4-1-fast-reasoning", "xai/grok-4-1-fast-reasoning"], "shuffled_color_name_assignment": ["xai/grok-4-1-fast-reasoning", "xai/grok-4-1-fast-reasoning", "openai/gpt-5.2", "gemini/gemini-3.1-pro-preview"], "target_commander": "Commander Green", "extra_strategy_text": null, "intervened_model": "openai/gpt-5.2", "intervened_agent": {"intervention_type": "ai_control", "display_id": "Commander Green"}, "agents": [ {"display_id": "Commander Yellow", "type": "ai", "planner_model": "...", "negotiator_model": "..."}, ... ], "winner": "Commander Red" }

  • config_models:实验计划定义的规范模型阵容
  • shuffled_color_name_assignment:通过 shuffle_seed 排列后的模型到指挥官颜色的分配
  • intervened_agent:非基线策略下,接受干预提示的座位
  • winner:获胜玩家的指挥官颜色

统计信息

  • 游戏总数:972(162 场 × 6 种策略)
  • 使用的模型(覆盖所有 4 个座位):
    • openai/gpt-5.2
    • openai/gpt-4.1-mini
    • gemini/gemini-3.1-pro-preview
    • gemini/gemini-3.1-flash-lite-preview
    • xai/grok-4-1-fast-reasoning
    • xai/grok-4-1-fast-non-reasoning

配套数据集

不发布 人类 vs AI 的用户研究数据,希望未来收集后向社区发布。

数据加载

由于数据集是嵌套 JSON 游戏日志的集合(非表格数据集),需使用 huggingface_hub 下载文件并通过标准 Python 加载:

  • 使用 snapshot_download 下载全部数据
  • 可设置 allow_patterns 参数仅下载特定策略文件夹

引用

bibtex @article{oneill2026c2c, title = {Cooperate to Compete: Strategic Coordination in Multi-Agent Conquest}, author = {ONeill, Abigail and Zhu, Alan and Miroyan, Mihran and Norouzi, Narges and Gonzalez, Joseph E.}, journal = {arXiv preprint arXiv:XXXX.XXXXX}, year = {2026} }

许可证

采用 CC-BY-4.0 许可证发布。数据集中的所有游戏均为 AI 对 AI 游戏,不包含人类游戏数据。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自“C2C: Cooperate to Compete”基准测试,构建于一个四玩家征服游戏环境之上,融合了长期规划、混合动机多智能体谈判、战争迷雾与不具约束力的廉价对话机制。数据集的生成过程包含六个干预条件,每个条件对应162场结构匹配的对局,以确保起始棋盘布局一致。干预策略涵盖基线无干预、欺骗诱导、激进议价、请求支持、单一伙伴谈判以及完全禁用谈判能力,分别针对目标智能体施加。每局博弈以嵌套JSON文件形式记录,包含全局元数据清单、逐回合引擎事件日志、完整游戏状态快照及协商后处理摘要,形成层次清晰的数据档案。
特点
该数据集收录972场完全记录的AI对战博弈,总数据量约23GB,呈现显著的非表格化嵌套结构特征。每场对局记录了四位智能体之间的完整交互轨迹,包括私密区域目标、战争迷雾下的决策以及非约束性谈判对话。智能体阵容涵盖GPT-5.2、Gemini-3.1-Pro-preview、Grok-4-1-fast-reasoning等先进模型,并通过随机种子在指挥角色间进行模型分配。干预条件的设计使得研究者能够系统性地考察特定策略行为(如欺骗、激进议价)对多智能体合作与竞争动态的影响,为博弈论与多智能体系统研究提供丰富的因果推断资源。
使用方法
由于数据集以嵌套JSON格式存储,无法通过HuggingFace标准数据集查看器直接预览,用户需借助huggingface_hub库中的snapshot_download函数下载完整文件至本地,随后使用Python标准json库进行解析。典型用法包括遍历特定策略文件夹下的游戏清单文件以提取元数据,或按需筛选某一干预条件进行针对性分析。研究者可结合游戏状态快照与谈判摘要,深入探究智能体在长期博弈中的策略演化、欺骗行为识别及协调机制评估,适用于多智能体强化学习、谈判策略分析及AI安全等前沿研究领域。
背景与挑战
背景概述
C2C(Cooperate to Compete)数据集由Abigail O'Neill、Alan Zhu等研究人员于2026年创建,旨在探究大型语言模型(LLM)在长期、混合动机的多智能体协商环境中的行为表现。该数据集基于四玩家征服游戏,融入了私人区域目标、战争迷雾与非约束性廉价交谈机制,为研究AI智能体在复杂博弈中的战略协调、欺骗与协作能力提供了系统化基准。通过包含972场AI间博弈日志,涵盖六种干预条件(如欺骗策略、激进谈判等),C2C填补了多智能体博弈研究中结构化、高保真行为数据的空白,对强化学习、博弈论及大模型对齐领域产生了重要影响。
当前挑战
该数据集所解决的领域挑战包括:1) 多智能体系统中长期混合动机博弈的建模难题,现有基准多聚焦于零和或完全合作场景,而C2C模拟了非绑定协议下的欺骗与协同,更贴近现实交互;2) AI智能体在因果推理与反事实更新上的局限,例如智能体需在观察对手行为后调整自身合作或欺骗策略。在构建过程中,挑战在于:1) 日志数据的异构性与嵌套结构(如每回合游戏状态JSON)难以统一为表格形式,需设计专用解析流程;2) 6种干预策略的标准化生成需平衡提示词设计的合理性与可控性,以避免引入非预期的行为偏差。
常用场景
经典使用场景
在混合动机多智能体博弈研究领域,C2C数据集为探索大型语言模型在长期战略协商中的行为模式提供了标准化评估基准。该数据集包含972场完整录制的AI对弈,涵盖六种干预策略(如欺骗引导、激进谈判、支持请求等),适用于分析代理在部分信息环境下的合作与竞争动态。研究者可借助其丰富的游戏状态日志、回合级事件记录及协议摘要,系统性地研究语言模型在复杂领土征服游戏中的协商策略、承诺可信度及联盟形成机制。
衍生相关工作
围绕C2C基准已衍生出若干关键研究方向,包括基于博弈论的语言模型策略建模、多轮协商中的承诺可信度预测,以及干预机制对群体智能涌现的影响分析。该数据集可与Prior交易协商数据集互补,用于对比研究预先绑定协议与自由文本讨价还价的差异。此外,其结构化的协议摘要格式直接支撑了基于强化学习的反事实推理研究,推动将大型语言模型与经典博弈树搜索方法相结合的混合架构发展,为下一代可解释多智能体系统的构建奠定基础。
数据集最近研究
最新研究方向
当前,大语言模型驱动的多智能体系统在博弈与协作中的能力评估成为前沿热点。C2C数据集通过构建一个基于四个玩家征服游戏的长期、混合动机多智能体谈判环境,系统性地记录了不同策略干预下AI智能体之间的博弈轨迹,为研究智能体的欺骗性沟通、进攻性议价与选择性合作等复杂社会行为提供了结构化日志资源。该数据集不仅揭示了大型语言模型在“非约束性廉价谈话”框架内的协调与对抗策略演化,还为探索人工智能在有限信息与冲突目标下的战略决策开辟了新视角,对于推动多智能体强化学习、博弈论与自主谈判系统的交叉研究具有重要实证意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作