five

LooksJuicy/Chinese-Roleplay-SingleTurn

收藏
Hugging Face2024-04-27 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/LooksJuicy/Chinese-Roleplay-SingleTurn
下载链接
链接失效反馈
官方服务:
资源简介:
为了填补中文角色扮演数据集的空白,现开源部分中文角色扮演单轮对话数据集。该数据集使用Refined-Anime-Text作为系统提示,小黄鸡随机查询作为输入,并调用个人角色扮演模型作为输出。数据集已处理为alpaca数据格式,便于处理和训练。经过验证,仅使用该数据集进行Lora微调即可获取一个效果还不错的模型。
提供机构:
LooksJuicy
原始信息汇总

数据集概述

数据集内容

  • 类型: 中文角色扮演单轮对话数据集
  • 用途: 用于填充中文角色扮演数据集的空白
  • 数据格式: alpaca数据格式

数据集特点

  • 数据来源: 使用Refined-Anime-Text作为system prompt,使用小黄鸡随机query作为输入,调用个人角色扮演模型作为输出
  • 训练效果: 仅使用该数据集进行Lora微调即可获取一个效果还不错的模型

数据集对比

  • 对比对象: chatGPT
  • 对比内容: 角色、问题、chatGPT的回答与数据集模型的回答

数据集不足

  • 模型版本: 使用的模型为两个月前版本,性能相对一般
  • 推理方式: 使用贪婪搜索进行推理,多样性不足
  • 内容过滤: 对模型回复安全过滤可能不充分,可能存在部分有害内容
搜集汇总
数据集介绍
main_image_url
构建方式
在角色扮演对话数据集领域,中文资源的匮乏一直是一个亟待解决的问题。为填补这一空白,该数据集采用了一种创新的合成策略:以Refined-Anime-Text作为系统提示(system prompt),并引入小黄鸡随机查询(random query)作为用户输入,随后调用个人角色扮演模型生成回复。所有对话均经过处理,统一转换为Alpaca数据格式,以便于研究者直接进行微调训练。这种构建方式巧妙地结合了现有高质量文本资源与模型生成能力,有效降低了人工标注成本。
使用方法
该数据集以Alpaca格式存储,兼容主流的指令微调框架,如LLaMA-Factory等。研究者可直接将其用于监督式微调(SFT)或作为奖励模型训练的基础数据。需特别注意的是,由于数据集曾用于个人模型的DPO训练,若直接使用CharacterEval榜单进行测试,可能导致评估分数异常偏高,产生偏差。建议在实际应用中结合其他基准测试或自行构建验证集,以确保模型性能评估的客观性与可靠性。
背景与挑战
背景概述
在自然语言处理领域,角色扮演对话系统因其在虚拟助手、游戏NPC及社交机器人中的广泛应用而备受关注。然而,高质量的中文角色扮演数据集长期匮乏,限制了相关模型的研发与评估。为填补这一空白,LooksJuicy/Chinese-Roleplay-SingleTurn数据集于近期发布,由匿名研究人员或团队基于合成方法构建。该数据集聚焦单轮角色扮演对话,核心研究问题在于如何通过有限数据高效激发模型的角色扮演能力。其影响力体现在为中文社区提供了首个大规模开源的角色扮演单轮对话资源,并验证了仅通过LoRA微调即可取得可观效果,推动了该领域的研究进展。
当前挑战
该数据集面临多重挑战。首先,在领域问题层面,角色扮演任务要求模型精准理解角色设定并生成符合性格的回应,而当前数据集的回复质量因依赖性能一般的旧版模型而受限,多样性不足且高频出现“微笑”“皱眉”等重复词汇,难以覆盖复杂对话场景。其次,在构建过程中,数据合成采用贪婪搜索推理,导致输出模式单一,且安全过滤不充分,可能残留有害内容,影响模型训练的安全性与鲁棒性。此外,数据集通过DPO训练与特定奖励模型耦合,易引入评估偏差,需谨慎用于公正测试。
常用场景
经典使用场景
在中文角色扮演与对话生成领域,该数据集为单轮角色扮演对话提供了高质量的指令微调样本。其典型应用场景是作为Alpaca格式的微调数据,用于训练能够模拟特定角色语气、性格和知识背景的语言模型。研究者可借助该数据集,通过LoRA等轻量化微调方法,快速获得具备角色扮演能力的对话模型,从而在动漫、游戏等虚构角色交互场景中实现更具沉浸感的文本生成。
解决学术问题
该数据集填补了中文角色扮演对话领域高质量单轮交互数据的空白,解决了现有数据集多集中于英文、多轮对话或缺乏角色一致性标注的问题。通过结合Refined-Anime-Text的system prompt与小黄鸡随机query,它构建了角色-用户交互的标准化范式,为研究角色适配性、对话个性保持和语言风格迁移提供了可控的基准数据,推动了中文角色扮演对话系统的评测与优化研究。
实际应用
在实际应用中,该数据集可赋能虚拟偶像、游戏NPC、智能客服等需要人格化交互的场景。例如,动漫社区可基于微调模型开发具有特定角色性格的聊天机器人,提升用户互动趣味性;教育领域可构建历史人物或文学角色的虚拟助手,辅助沉浸式学习。尽管回复多样性和安全性存在局限,但其轻量高效的特点使其成为中小团队快速部署角色扮演功能的实用选择。
数据集最近研究
最新研究方向
在中文角色扮演领域,单轮对话数据集的研究正逐步聚焦于高质量合成数据的生成与模型对齐优化。该数据集通过整合动漫文本作为系统提示,并借助随机查询驱动个人角色扮演模型输出,填补了中文角色扮演语料库的空白,为基于LoRA的微调提供了高效基准。然而,当前研究也揭示了数据合成中的关键挑战:早期模型版本在回复多样性上存在局限,高频词汇如“微笑”“皱眉”的重复出现暗示了贪婪搜索策略的弊端;同时,安全过滤的不足提示需引入更严格的毒性检测机制。前沿方向正转向利用reward model进行DPO训练以缓解评估偏差,并探索更优的合成方案以提升角色一致性和交互自然度,这对推动中文角色扮演模型在娱乐、教育等场景的落地具有重要实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作