dnd-35-mechanics-170k
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/m0no1/dnd-35-mechanics-170k
下载链接
链接失效反馈官方服务:
资源简介:
这是一个平衡且经过去重的最终版数据集,用于训练Llama 3.1 8B模型,使其能够正确处理D&D 3.5机制。数据集包含170,018个训练示例和3,000个验证示例,来源于经过清洗和审核的数据以及新生的平衡示例。数据集的分布均衡,涵盖了动作、社交、创意等不同类型的例子,并确保了自然语言多样性以及覆盖边缘情况。
创建时间:
2025-07-18
原始信息汇总
D&D 3.5 Mechanics Dataset - FINAL VERSION 概述
数据集基本信息
- 名称: D&D 3.5 Mechanics Dataset - FINAL VERSION
- 用途: 训练Llama 3.1 8B模型以正确处理D&D 3.5游戏机制
- 状态: 最终版本,已去重且平衡
数据集统计
文件组成
final_train.jsonl: 170,018个训练示例(42MB)final_val.jsonl: 3,000个验证示例(668KB)llama3_mechanics_final.yaml: Axolotl训练配置文件
数据来源与组成
- 总示例数: 173,018(170k训练 + 3k验证)
- 来源:
- 121,881个示例来自o3的清理/审核数据
- 48,137个新生成的平衡示例
- 3,000个验证示例(由o3分层)
数据分布(平衡良好)
- 动作(战斗/技能/法术): 50.2%
- 社交(对话/NPC): 32.8%
- 创意(叙事角色扮演): 15.9%
- 澄清: 0.6%
- 其他: 0.4%
质量指标
- 无重复(MinHash-LSH去重,阈值0.85)
- 所有输出为有效JSON且少于160字符
- 自然语言多样性(无机器人模式)
- 覆盖边缘情况(长叙述、模糊输入)
- 无占位符或无效数据
训练说明
-
复制数据集到训练环境: bash cp -r DND_MECHANICS_FINAL_DATASET_170K /workspace/data/
-
安装Axolotl(如需): bash pip install axolotl
-
验证配置: bash axolotl validate-config /workspace/data/DND_MECHANICS_FINAL_DATASET_170K/llama3_mechanics_final.yaml
-
训练: bash accelerate launch -m axolotl.cli.train /workspace/data/DND_MECHANICS_FINAL_DATASET_170K/llama3_mechanics_final.yaml
预期结果
使用此平衡数据集,Llama 3.1 8B应能:
- 正确识别需要掷骰子的动作与纯角色扮演
- 处理带有缩略、犹豫和多样性的自然语言
- 处理长叙述描述而不强制引入机制
- 识别模糊输入并请求澄清
- 输出干净的JSON以便游戏机制集成
重要注意事项
- 修复了Qwen3 14B错误要求角色扮演动作掷骰子的关键问题
- 验证集已预分层,不要在Axolotl中使用
val_set_size - 训练期间监控
exact_match_json指标(目标≥0.9) - 数据集已由o3进行广泛质量审核
数据集创建过程
- 从o3的26k精选示例开始
- 使用GPT-4o-mini生成125k+示例
- 应用MinHash-LSH去重(移除120k+重复项)
- o3审核并清理(移除27k无效行)
- 生成48k平衡示例以修复分布
- 最终去重与合并
搜集汇总
数据集介绍

构建方式
在龙与地下城3.5版规则研究领域,该数据集通过多阶段严谨流程构建。初始采用o3精选的2.6万条高质量样本,结合GPT-4o-mini生成12.5万条扩展数据,运用MinHash-LSH算法以0.85阈值去重剔除12万条冗余条目。经人工审核移除2.7万条无效数据后,针对性生成4.8万条平衡样本优化分布,最终形成包含17万训练样本和3000验证样本的精密集合。
特点
数据集呈现卓越的质量特征与结构平衡性,涵盖动作机制(50.2%)、社交交互(32.8%)和叙事创作(15.9%)三大核心维度。所有输出均遵循160字符内的标准JSON格式,确保游戏机制集成的规范性。数据天然语言多样性显著,包含收缩表达、犹豫句式等自然语言特征,同时全面覆盖长叙事描述和模糊输入等边缘场景,满足专业模型训练需求。
使用方法
使用者可通过Axolotl训练框架快速部署,将数据集配置文件与训练脚本协同运作。训练过程中需重点关注exact_match_json指标,目标阈值设定为0.9以上以确保力学处理的精确性。验证集已预先分层处理,无需额外配置验证比例,这种设计保障了模型能准确区分骰子投掷需求与纯角色扮演场景,实现自然语言与游戏机制的无缝衔接。
背景与挑战
背景概述
龙与地下城3.5版规则数据集由专业研究团队于近期开发完成,专为训练Llama 3.1 8B模型处理桌面角色扮演游戏机制而构建。该数据集由o3团队主导设计,整合了经过审核的原始数据与新增生成的平衡样本,总计包含17.3万条高质量示例。其核心研究目标在于解决游戏机制识别与自然语言处理的交叉领域问题,通过精确标注战斗技能、社交对话和叙事扮演等多元场景,为游戏人工智能的发展提供了重要的数据基础。
当前挑战
该数据集致力于解决角色扮演游戏中自然语言指令与游戏机制映射的复杂问题,特别是区分需要骰子裁决的操作与纯叙事行为之间的模糊边界。构建过程中面临多重挑战:原始数据存在大量重复与无效内容,需采用MinHash-LSH算法以0.85阈值去重;生成样本需保持语言自然性避免机械模式;为确保类别平衡,额外生成4.8万条样本调整数据分布,并经过严格审计移除2.7万条无效数据,最终形成覆盖边缘案例的标准化数据集。
常用场景
经典使用场景
在角色扮演游戏的智能化发展领域,该数据集为训练大型语言模型理解龙与地下城3.5版规则机制提供了核心支持。模型通过学习战斗行动、技能施放、社交互动及叙事创作等多维度数据,能够准确解析玩家自然语言指令,区分需要骰子裁决的机械性操作与纯角色扮演行为,为游戏主持人和玩家提供流畅的规则交互体验。
解决学术问题
该数据集有效解决了游戏人工智能领域自然语言理解与规则系统结合的学术难题。通过提供高质量标注数据,它帮助研究者突破传统规则引擎的局限性,实现模糊指令解析、长文本叙事处理和多轮对话维护等关键技术挑战,为基于大语言模型的游戏交互系统建立了可复现的研究基准。
衍生相关工作
基于该数据集衍生的经典工作包括智能游戏主持系统开发、规则自适应对话生成框架以及多模态桌游辅助平台。这些成果不仅推动了角色扮演游戏智能化的发展,更为交互式叙事生成、人机协作创意写作等领域提供了技术范式,催生了新一代游戏人工智能研究浪潮。
以上内容由遇见数据集搜集并总结生成



