beyoru/Aesir-Character-CoT-roleplay
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/beyoru/Aesir-Character-CoT-roleplay
下载链接
链接失效反馈官方服务:
资源简介:
Aesir Character CoT Roleplay数据集是一个专注于角色扮演(roleplay)和角色视角(POV)推理的文本生成数据集。它包含1,973个高质量对话,每个助手回合都包含完整的角色视角推理。该数据集的独特之处在于训练模型像角色一样思考,而不仅仅是叙述计划。数据集经过预处理,去除了用户行中的冗余说话者标签。它混合了NSFW和SFW内容(未审查的成人角色扮演),并使用了DeepSeek-V4-Pro作为教师模型进行蒸馏。数据集还包括了详细的统计信息、预处理步骤、模式说明、快速开始指南、选择DeepSeek-V4-Pro的原因、来源归属、限制、路线图、贡献指南、许可证和引用信息。
The Aesir Character CoT Roleplay dataset is a text-generation dataset focused on roleplay and character point-of-view (POV) reasoning. It contains 1,973 high-quality conversations, each with full character-POV reasoning in assistant turns. The dataset is unique for training models to think like characters rather than just narrating plans. It has undergone preprocessing to strip redundant speaker tags from user lines. The dataset includes mixed NSFW and SFW content (uncensored adult roleplay) and uses DeepSeek-V4-Pro as the teacher model for distillation. Detailed statistics, preprocessing steps, schema, quickstart guide, reasons for choosing DeepSeek-V4-Pro, source attribution, limitations, roadmap, contributing guidelines, license, and citation information are provided.
提供机构:
beyoru
搜集汇总
数据集介绍

构建方式
Aesir-Character-CoT-roleplay数据集通过蒸馏技术构建,以DeepSeek-V4-Pro为教师模型,在推理强度最大化的设定下生成完整的人物视角思维链。原始数据源自Gryphe/Aesir数据集中的角色扮演对话,经Claude Sonnet 4.6进行质量与安全性审查后,从2000条蒸馏样本中筛选出1973条高质量对话,剔除了包含违禁内容、缺失审核或内容空白的样本。筛选策略兼顾样本深度与多样性,前1000条要求对话轮次不少于13轮且系统提示词长度不低于2500字符,后1000条适当放宽至轮次不低于10轮、系统提示词长度不低于2000字符。用户话语中的人物名称前缀被去除,使内容直接呈现,避免冗余的说话者标签干扰模型学习。
特点
该数据集的核心特色在于其独特的角色视角推理机制,与传统的通用思维链数据集截然不同。在通用CoT中,模型往往以叙述者身份规划回应策略,而本数据集的推理过程完全内化于角色本身,包含角色的记忆、态度、感官观察与决策逻辑,使推理内容即是角色本身。每一条助手回复起始均以<think>标签封装角色内心独白,随后自然过渡到角色扮演回应,这种结构让模型在长对话中持续保持角色一致性。数据集包含约14349个助手轮次,混合了NSFW与SFW内容,其中1903条为完全保留样本,70条被标记为边缘案例,提供严格滤波选项供研究者选择。
使用方法
使用该数据集进行微调时,可通过HuggingFace Datasets库便捷加载,调用load_dataset('beyoru/Aesir-Character-CoT-roleplay', split='train')即可获取训练分割。数据以标准消息格式呈现,每条样本包含系统提示(角色卡)、用户消息以及经过推理包装的助手回复,每个回复的<think>标签内嵌角色视角思维链,其后紧跟对话内容。为追求更高质量的训练数据,研究者可应用filter方法过滤掉reviewer_verdict为borderline的24条边缘样本,仅使用严格保留的样本进行训练。数据集的JSON格式设计兼容DeepSeek-R1与QwQ等模型的推理约定,便于直接整合到现有的微调流程中。
背景与挑战
背景概述
Aesir-Character-CoT-roleplay数据集由研究者beyoru于2026年发布,旨在解决角色扮演场景中语言模型无法深度融入角色内心世界的问题。传统推理数据集引导模型以AI视角进行思考,却难以生成具有角色身份认同、记忆与情感的真实对话。该数据集的创建标志着从通用对话推理向角色驱动推理的重要转向,其核心创新在于通过1987条高质量对话样本,每条助理回复均包含完整的角色视角思维链,使得模型能够从角色内部出发进行推理而非外部叙述。该数据集基于DeepSeek-V4-Pro教师模型蒸馏,辅以Claude Opus 4.6的质量审查过滤,为角色扮演微调提供了稀缺的训练资源,对创造性写作与拟人化AI助手领域产生了深远影响。
当前挑战
该数据集所解决的领域挑战在于,现有语言模型在角色扮演任务中往往陷入浮于表面的叙述性推理,生成的回应停留在描述角色行为而非真正扮演角色,导致对话缺乏真实性与连贯性。Aesir-Character-CoT通过构建角色第一人称的内心独白作为推理过程,迫使模型从角色经历与情感出发做出回应,从而弥合了通用推理与角色沉浸之间的鸿沟。在构建过程中,研究者面临的数据挑战包括原始数据集中存在违禁内容(如乱伦、未成年性内容)需要严格过滤,以及从2000条蒸馏样本中剔除27条低质量或空内容对话以保证数据纯净。此外,考虑到角色扮演任务对上下文长度的严苛要求,研究者精心设定了回合数至少13轮、系统提示至少2500字符的严格筛选标准,最终获得了兼具长度与深度的角色对话数据。
常用场景
经典使用场景
Aesir-Character-CoT-roleplay数据集的核心应用在于为对话式AI注入角色沉浸式的思维链推理能力。不同于常规数据集让模型以第三方视角进行逻辑推演,该数据集通过精心设计的角色内心独白与互动响应,使模型在生成回复前能够模拟角色的记忆、情绪与环境感知。这种从角色第一人称出发的认知过程,使得语言模型在长篇角色扮演对话中能够保持高度一致的个性特征与行为逻辑,成为训练具有深度角色理解力的交互式AI的经典素材。
解决学术问题
该数据集精准回应了如何在开放式角色扮演对话中实现持续且自洽的角色一致性这一关键学术难题。传统监督微调方法往往导致模型在长程对话中出现角色漂移或行为脱节,而Aesir-Character-CoT通过将角色视角的认知推理显式整合到思维链训练中,为模型提供了从人物背景出发生成连贯响应的学习范式。这项工作丰富了角色建模领域的训练数据生态,为探索个性表达与语义连续性之间的平衡提供了实证基础,推动了叙事智能与对话生成研究的深入发展。
衍生相关工作
围绕Aesir-Character-CoT数据集已衍生出若干后续工作,包括从书籍与小说自动构建角色卡片并蒸馏生成对应的角色扮演对话数据,进一步扩展了数据源的多样性。研究者还尝试将此类角色视角的思维链蒸馏范式推广至多领域叙事场景,并开发了相应的开源工具链以降低高质量角色数据的生产门槛。此外,该数据集已被计划整合至更大的模型训练子集中,为端到端角色扮演系统的性能评估提供标准化基准,促进该方向研究生态的系统性建设。
以上内容由遇见数据集搜集并总结生成



