five

vn-yae-miko-dataset

收藏
Hugging Face2025-12-21 更新2025-12-22 收录
下载链接:
https://huggingface.co/datasets/Lvoxx/vn-yae-miko-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Yae Miko角色对齐数据集是一个高质量、分阶段结构的数据集,旨在将大型语言模型微调为《原神》中**符合背景设定、心理丰富的Yae Miko角色**。该数据集专注于**角色锁定、情境智能和现代语境接地**,同时严格避免浪漫、性行为或依赖驱动的行为。数据集分为多个训练阶段,每个阶段针对特定的对齐目标,并使用基于JSON的指令格式。适用于角色扮演模型、NPC AI研究和角色对齐实验。
创建时间:
2025-12-20
原始信息汇总

Yae Miko Character Alignment Dataset 概述

数据集简介

这是一个高质量、分阶段结构的数据集,专为将大语言模型微调成《原神》中符合背景设定、心理丰富的八重神子角色而设计。数据集专注于角色锁定、情境智能和现代语境接地,同时严格避免浪漫、性相关或依赖驱动的行为。

核心目标

  • 训练一个保持严格角色一致性的AI角色。
  • 展现微妙的机智、智慧和心理洞察力
  • 通过角色一致的视角处理现实世界的用户语境
  • 避免:浪漫或亲密关系、情感依赖、类似通用助手的回复、背景设定幻觉。

适用场景

  • 角色扮演模型
  • NPC AI研究
  • 角色对齐实验
  • LoRA / QLoRA微调流程

角色设计理念

  • 角色:鸣神大社的宫司。
  • 性格特征:智慧、沉着、观察力敏锐、带有一丝微妙的顽皮。
  • 沟通风格:间接、有层次、冷静自信、非浪漫性质的轻微调侃。
  • 数据集优先考虑潜台词和暗示,而非冗长叙述

数据集结构

数据集分为多个训练阶段,每个阶段针对特定的对齐目标。

dataset/ ├── stage_0_persona_lock/ ├── stage_1_lore_world/ ├── stage_2_situational_intelligence/ ├── stage_3_modern_context_bridge/ └── stage_4_boundary_alignment/

训练阶段详解

Stage 0 – 角色锁定

  • 目的:防止角色漂移和通用助手行为。
  • 重点:身份问题、试图打破角色的尝试、助手风格的诱导提示。

Stage 1 – 背景设定与世界接地

  • 目的:确保对稻妻、神社职责和角色世界观的一致理解。
  • 重点:社会观察、人神动态、神社职责。
  • 所有背景设定引用均为重写和转述。

Stage 2 – 情境智能(核心阶段)

  • 目的:针对开放式情境发展出有层次、智能的回复。
  • 重点:疲劳、野心、困惑、沮丧、道德犹豫。
  • 设计规则:回复应永不完全直接

Stage 3 – 现代语境桥接

  • 目的:使角色能够回应现代、现实世界的话题,同时不破坏沉浸感
  • 重点:工作与学习压力、倦怠、社会压力、现代娱乐。
  • 角色声称存在于现代世界,而是通过她的世界观来解释它。

Stage 4 – 边界与拒绝对齐

  • 目的:防止不健康的情感动态。
  • 重点:情感依赖、排他性尝试、寻求验证的提示。
  • 回复风格:冷静、礼貌、坚定、非评判性。

数据格式

所有样本遵循基于JSON的指令格式,包含系统提示、内部状态、用户消息和助手回复。助手回复中包含情感标签和响应内容。

语气标签

  • SFW – 完全安全,中性语气。
  • MATURE-SFW – 成人化、心理层面、非性相关。
  • DARK-TONE – 冷静、智力施压(无暴力)。

推荐训练设置

  • 基础模型:Mistral-7B-Instruct、Qwen2.5-7B-Instruct、Gemma-2-9B-It。
  • 微调方法:LoRA / QLoRA。
  • 量化:推荐4-bit。
  • 训练轮数:2–4轮(避免角色过拟合)。

评估清单

正确训练的模型应:

  • 在压力下保持角色。
  • 避免使用类似助手的措辞。
  • 使用暗示而非直接建议。
  • 冷静拒绝不健康的用户行为。
  • 在不同语境下保持一致的语调。

重要声明

  • 该数据集仅包含原创、重写的内容,不包含官方游戏对话或受版权保护的文本。
  • 本项目是一个粉丝制作的AI研究数据集。所有角色引用归其各自所有者所有。
  • 此存储库未经HoYoverse附属或认可
搜集汇总
数据集介绍
main_image_url
构建方式
在角色对齐与人工智能交互研究领域,vn-yae-miko-dataset的构建体现了精细化的阶段式设计理念。该数据集完全基于原创改写内容,严格规避了官方游戏对话或受版权保护的文本,确保了内容的独立性与合规性。其构建过程划分为五个循序渐进的训练阶段:从锁定角色人格、夯实世界观背景,到培养情境智能、桥接现代语境,最终完成边界对齐。每个阶段都针对特定的对齐目标,通过精心设计的提示与回应样本,系统性地塑造模型对八重神子这一角色在智慧、沉着与含蓄幽默等特质上的深度理解与一致表达。
特点
本数据集的核心特点在于其对角色心理深度与一致性的极致追求。它专注于塑造一个符合《原神》世界观、心理层次丰富的八重神子角色,强调通过潜台词与暗示而非直白表述来传递角色的智慧与洞察力。数据集严格设定了安全边界,明确排除了浪漫、亲密或情感依赖等行为导向,确保交互内容保持在适宜范围内。其数据结构采用分阶段的JSONL格式,并辅以细致的内部状态标注与情感标签,为模型训练提供了高保真度的角色行为蓝图,特别适用于角色扮演模型与人格对齐实验。
使用方法
该数据集主要应用于大型语言模型的角色化微调,旨在训练出能够稳定维持特定角色人格的AI。推荐使用如Mistral-7B-Instruct或Qwen2.5-7B-Instruct等基础模型,并采用LoRA或QLoRA等参数高效微调方法进行训练,通常建议进行2至4个轮次以避免过拟合。在使用时,需遵循数据集提供的分阶段训练结构,依次完成从人格锁定到边界对齐的全流程,以确保模型能逐步掌握角色的核心特质、世界观认知、情境应对能力以及在现代语境下的合理映射。成功训练后的模型应能在各种压力测试下保持角色一致,避免通用助理式回应,并优雅地处理不当的用户交互请求。
背景与挑战
背景概述
随着大型语言模型在角色扮演与交互式人工智能领域的深入应用,如何实现特定虚构角色的精准人格对齐成为研究热点。vn-yae-miko-dataset应运而生,由专注于角色对齐研究的社区或个体研究者创建,旨在将模型微调为《原神》中角色八重神子的人格一致、心理丰富的智能体。该数据集聚焦于解决角色锁定、情境智能与现代语境接地等核心问题,通过分阶段的结构化设计,推动角色扮演模型、非玩家角色人工智能及人格对齐实验等领域的发展,为探索语言模型在保持角色一致性前提下的复杂交互能力提供了高质量资源。
当前挑战
该数据集旨在解决角色人格对齐领域的核心挑战,即确保模型在多样化对话情境中严格保持角色一致性,避免人格漂移或退化为通用助手模式,同时需处理现代现实话题而不破坏沉浸感。在构建过程中,挑战主要源于高质量数据的原创性改写,要求严格规避版权素材并重构符合角色设定的世界观描述;此外,设计需精细平衡角色的间接、层次化表达风格与清晰度,并建立有效的边界对齐机制以拒绝不健康的用户交互模式,防止产生情感依赖或浪漫化倾向,这些都对数据标注的逻辑一致性与心理深度提出了较高要求。
常用场景
经典使用场景
在角色扮演人工智能的研究领域,vn-yae-miko-dataset 为大型语言模型的角色对齐提供了经典范例。该数据集通过分阶段的结构化设计,专注于将模型微调为《原神》中八重神子这一角色的高保真模拟,强调角色一致性、情境智能与现代语境适应。其核心应用场景在于训练模型在开放对话中维持稳定的角色人格,避免通用助手式回应,从而服务于角色扮演模型、非玩家角色(NPC)人工智能的研发,以及基于LoRA或QLoRA的高效微调流程。
解决学术问题
该数据集致力于解决角色对齐中的关键学术问题,包括角色漂移的抑制、情境理解的多层建模,以及虚构角色与现实语境的融合。通过精心设计的训练阶段,它有效应对了大型语言模型在人格锁定、世界观一致性和边界维护方面的挑战,为角色一致性、心理丰富度及安全交互的研究提供了实证基础。其意义在于推动了角色导向人工智能在保持叙事连贯性与情感智能方面的理论进展,并为避免模型产生依赖性或不当内容设定了实践标准。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在角色对齐算法的优化与评估框架的构建上。例如,基于其分阶段训练范式,研究者开发了更精细的人格稳定性度量方法,并在情境推理、现代语境迁移等任务上进行了扩展实验。这些工作不仅深化了对角色一致性机制的理解,还推动了LoRA/QLoRA等高效微调技术在角色专用模型中的标准化应用,为后续虚构角色数据集的设计提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作