WereWolf-Plus Game Configurations
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/MinstrelsyXia/WereWolfPlus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了在狼人杀游戏中进行的实验配置和性能指标,旨在评估多代理策略推理能力。其中涵盖了不同大型语言模型(LLM)的度量标准,以及先知和警长等角色的配置情况,并探讨了经验池对游戏玩法的影响。实验规模涉及8至12名玩家,在多种配置下进行。该任务的目标是评估狼人杀游戏中的多代理战略推理能力。
提供机构:
MinstrelsyXia
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个基于DSGBench的狼人游戏配置项目,实现了完整的狼人游戏流程,支持灵活的游戏设置和多种大型语言模型(LLM)的配置与评估。项目提供了详细的配置文件结构,包括模型API设置、游戏角色分配和评估参数,便于进行多模型对战实验和性能分析。
以上内容由遇见数据集搜集并总结生成



