Aesir-Character-CoT-roleplay

Hugging Face2026-05-03 更新2026-05-04 收录

下载链接：

https://huggingface.co/datasets/beyoru/Aesir-Character-CoT-roleplay

下载链接

链接失效反馈

官方服务：

资源简介：

Aesir Character CoT Roleplay 是一个专注于角色扮演（RP）中角色视角推理（Character-POV reasoning）的高质量对话数据集。该数据集包含1,973个经过筛选的对话（从2,000个原始对话中过滤掉27个不符合要求的内容），共计约14,349个助手回合，每个回合都包含完整的角色视角推理。数据来源于Gryphe/Aesir原始数据集，经过DeepSeek-V4-Pro模型蒸馏生成，并通过Claude Opus 4.6进行质量和安全审核。数据集适用于文本生成任务，特别是需要模型在长对话中保持角色一致性的角色扮演场景。数据预处理中移除了用户对话中的角色名前缀，使内容更直接。数据集包含混合的NSFW和SFW内容（未审查的成人角色扮演），并标注了质量等级和审核结果。

Aesir Character CoT Roleplay is a high-quality dialogue dataset focused on Character-POV reasoning in role-playing (RP). The dataset contains 1,973 filtered dialogues (from 2,000 original dialogues, 27 were filtered out for not meeting requirements), totaling approximately 14,349 assistant turns, each with complete character perspective reasoning. The data originates from the Gryphe/Aesir original dataset, distilled by the DeepSeek-V4-Pro model, and underwent quality and safety review by Claude Opus 4.6. The dataset is suitable for text generation tasks, particularly role-playing scenarios requiring models to maintain character consistency in long dialogues. During preprocessing, character name prefixes in user dialogues were removed to make the content more direct. The dataset contains a mix of NSFW and SFW content (unreviewed adult role-play) and is annotated with quality levels and review results.

创建时间：

2026-04-28

原始信息汇总

数据集概述：Aesir-Character-CoT-roleplay

基本信息

数据集名称：Aesir Character CoT Roleplay
许可证：Apache-2.0
语言：英语
数据规模：1,973 条高质量对话（从 2,000 条蒸馏数据中筛选，剔除了 27 条）
任务类别：文本生成
标签：角色扮演、思维链、角色 AI、蒸馏、创意写作、SFT、推理努力最大化、DeepSeek AI

数据集来源与构建

原始数据来源：Gryphe/Aesir 数据集，经 PJMixers-Dev/Gryphe-Aesir-RPG-Charcards-Opus-Mixed-split 打包
教师模型：deepseek-v4-pro，推理参数设为 reasoning_effort=max
质量审核模型：claude-sonnet-4-6（边缘情况回退到 Opus）
筛选标准：前 1000 条要求 turns ≥ 13 且 sys_prompt ≥ 2500，后续 1000 条放宽至 turns ≥ 10 且 sys_prompt ≥ 2000
内容类型：混合 NSFW 和 SFW（未审查的成人角色扮演）

核心特性：角色视角推理（Character-POV Reasoning）

该数据集与通用角色扮演数据集的关键区别在于推理方式：

通用 CoT 模型：模型会叙述自己的生成计划（如“用户问 Belle 关于她的武器，我应该以符合她性格的方式回应”），对训练角色“成为”角色无效。
本数据集：推理内容完全处于角色内部，包含角色的记忆、态度、感官观察和决策过程。例如： text <think> 他在看 Skullcleaver。哈，总是这样。两年前的冬天，在灰山口北边从一个山巨人那里拿到的。那家伙差点连我的胳膊一起带走，但一个连单手都打不赢的 Belle 根本不配用这把武器。他看起来软弱的很。城市人的手。大概是想听故事。好吧——我会给他讲个故事，但他得请下一轮的酒。 </think> 咧嘴笑着，单手把斧头扛在肩上 “她叫 Skullcleaver。没错，这个名字是用战绩换来的——但故事要用酒换，朋友，你的酒杯看起来快空了。”

数据预处理

原始 Gryphe/Aesir 数据集中，用户对话行包含角色名称前缀（如 Rin: You enter the room...），本数据集已去除该前缀（99.9% 的用户轮次），使内容直接呈现。

数据格式（Schema）

每条样本包含以下字段： json { "messages": [ {"role": "system", "content": "<角色卡>"}, {"role": "user", "content": "..."}, { "role": "assistant", "content": "<思考内容> <角色内心独白> </思考内容>

<角色扮演回应>" } ], "quality_rank": 0, "split": "0", "orig_index": 1234, "model": "deepseek-v4-pro", "reviewer_verdict": "keep" }

推理内容包裹在 <think>...</think> 标签中（遵循 DeepSeek-R1/QwQ 格式），位于助手回答的开头。
reviewer_verdict 字段：1,903 条为 keep，70 条为 borderline

质量与限制

已过滤内容：9 条因不当内容（乱伦、未成年人性内容）被拒绝
边界样本：24 条标记为 borderline，可用于严格训练时进行剔除
局限性：
- NSFW 内容混合，仅限成人使用
- 推理为角色视角的最佳努力结果，偶尔出现“我需要……”等表述，但上下文属于角色思考
- 蒸馏速度较慢，因管线经过多个模型

快速使用

python from datasets import load_dataset ds = load_dataset("beyoru/Aesir-Character-CoT-roleplay", split="train")

严格过滤（剔除 24 条 borderine 样本）

ds = ds.filter(lambda r: r["reviewer_verdict"] != "borderline")

引用信息

bibtex @misc{aesir_character_cot_2026, author = {beyoru}, title = {Aesir-Character-CoT-roleplay: Character-POV reasoning dataset for roleplay fine-tuning}, year = {2026}, publisher = {Hugging Face}, howpublished = {url{https://huggingface.co/datasets/beyoru/Aesir-Character-CoT-roleplay}} }

搜集汇总

数据集介绍

构建方式

该数据集基于Gryphe提供的原始角色扮演语料进行蒸馏与重构，利用DeepSeek-V4-Pro模型在最大推理努力模式下生成完整的角色第一人称思维链。原始数据经过两阶段质量过滤：首先保留对话轮次不低于13轮且系统提示不少于2500字符的优质样本1000条，再以轮次不低于10轮且系统提示不少于2000字符的宽松标准扩充1000条，最终获得1973条高质量对话。用户发言中冗余的角色名前缀被剥离，同时经由Claude Sonnet 4.6进行质量与安全审查，剔除9条违规内容，并标记24条边缘样本。

特点

该数据集最鲜明的特色在于其角色视角的思维链设计，与传统推理数据集中模型以旁观者身份规划回复不同，这里的推理过程完全内化于角色本身——包含记忆、情绪、感官体验与即时决策。每条助手回复均由被<think>标签包裹的角色内心独白与随后的角色扮演响应组成，使得模型能够学习从角色内部进行思考并自然生成响应。数据集混合了NSFW与SFW内容，覆盖广泛的角色扮演场景，且用户发言中的角色名前缀已剥离，确保对话文本的流畅性。

使用方法

用户可通过Hugging Face的datasets库直接加载该数据集，调用load_dataset函数并指定仓库名称即可获取训练集。每一条样本包含标准的messages字段，以OpenAI格式组织系统提示、用户输入与带有思维链的助手回复。对于追求严格训练的用户，可通过reviewer_verdict字段过滤掉标记为borderline的24条边缘样本。该数据集适用于对模型进行角色扮演微调，特别是训练模型在长程对话中保持角色一致性，可直接作为监督微调数据使用。

背景与挑战

背景概述

Aesir-Character-CoT-roleplay数据集由研究者beyoru于2026年创建，旨在解决角色扮演场景下大语言模型角色一致性不足的核心问题。该数据集从Gryphe/Aesir原始语料中蒸馏出1,973条高质量对话，每条均包含完整的角色视角推理链（Character-POV CoT），这是与常规角色扮演数据集的关键区别。通过DeepSeek-V4-Pro模型以最大推理努力生成，并经由Claude Opus 4.6严格筛选，该数据集推动了角色扮演语言模型从“叙述计划”到“真正成为角色”的范式转变，对AI角色扮演、创意写作和人格化对话系统等领域具有重要影响力。

当前挑战

Aesir-Character-CoT-roleplay数据集主要面临三重挑战。其一，角色扮演领域长期存在模型难以维持角色一致性的问题——传统CoT数据集迫使模型以第三人称规划对话，而非从角色内心出发自然生成响应；该数据集通过角色视角推理从根本上解决此问题。其二，构建过程中，数据蒸馏面临模型选择困境——主流供应商如OpenAI和Anthropic仅返回推理摘要而非完整推理轨迹，唯有DeepSeek-V4-Pro能提供完整CoT，限制了教师模型的选用。此外，原始数据中存在违规内容（如近亲、未成年色情），需人工审核清除，且长对话筛选（轮次≥13、系统提示≥2500字符）进一步加剧了高质量样本的获取难度。

常用场景

经典使用场景

在角色扮演与交互式叙事的学术探索中，Aesir-Character-CoT-roleplay数据集为大型语言模型的角色一致性推理提供了关键训练资源。其核心应用在于让模型习得从角色内部视角进行连贯思考的能力，而非仅仅模拟外在行为。通过将角色的内心独白、记忆碎片与感官观察融入推理链条，该数据集使模型能够在长篇对话中维持鲜明且稳定的角色人格，彻底告别了传统角色扮演数据集中模型机械叙述‘我应如何反应’的表层模式，转而实现‘我即是角色’的深度沉浸式交互。

解决学术问题

该数据集精准回应了当前角色扮演对话系统研究中一个核心困境：模型虽能生成符合角色设定的回复，却难以在长程交互中维持内在一致的角色认知与情感逻辑。传统监督微调数据往往只包含对话文本，缺乏从角色世界观出发的思考过程，导致模型频繁出现‘出戏’现象。Aesir-Character-CoT通过蒸馏DeepSeek-V4-Pro的完整推理痕迹，将角色内省的认知过程显式编码为思维链，使模型能够学习到角色决策背后的情感动机、记忆唤醒与环境感知，从而在根本上提升了对话系统在角色一致性方面的表现。

衍生相关工作

围绕该数据集的构建理念，衍生了一系列推动角色推理技术发展的经典工作。数据集的创建者基于相同的蒸馏框架，开发了从书籍与小说文本中自动生成角色卡并提取角色认知推理的开发工具（RP-creator），并发布了如Aisaka-LN-v4等派生数据集。这些工作共同形成了一个技术谱系：从高质量、经过安全审查的角色对话数据蒸馏，到系统化的角色认知建模框架，再到面向不同文学与游戏领域的扩展数据集，展示了如何通过显式的思维链监督使语言模型掌握角色扮演中的心理具身能力，为对话系统的人格化与情感计算研究开辟了新路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集