ChatAnime
收藏arXiv2025-08-08 更新2025-08-12 收录
下载链接:
https://github.com/LanlanQiu/ChatAnime
下载链接
链接失效反馈官方服务:
资源简介:
ChatAnime是一个针对情感支持的动漫角色扮演对话数据集。该数据集由60个情感中心的2轮对话场景组成,包括2400个人类撰写的答案,24000个LLM生成的答案,以及超过132000个人类李克特量表注释。数据集旨在评估LLM驱动的虚拟角色如何与真实用户建立情感联系,并提供了用户经验中心的评估系统,其中包括情感支持能力和响应多样性两个维度。
ChatAnime is an anime role-playing dialogue dataset designed for emotional support. This dataset consists of 60 emotion-centric two-turn dialogue scenarios, including 2400 human-written responses, 24000 LLM-generated responses, and over 132000 human-provided Likert-scale annotations. The dataset aims to evaluate how LLM-powered virtual characters can establish emotional connections with real users, and provides a user experience-centered evaluation system covering two dimensions: emotional support capability and response diversity.
提供机构:
上海期智研究院, 清华大学, 北京大学
创建时间:
2025-08-08
原始信息汇总
ChatAnime数据集概述
数据集简介
- 名称:ChatAnime
- 类型:情感支持角色扮演(ESRP)对话数据集
- 特点:首个专注于情感支持角色扮演的数据集
数据构成
- 角色选择:20个来自全球主要动漫社区的顶级角色
- 场景设计:60个以情感为中心的真人场景问题
- 参与者:
- 40名经过严格筛选的中国动漫爱好者
- 10个大型语言模型(LLM)
- 数据规模:
- 2,400条人工撰写的回答
- 24,000条LLM生成的回答
- 超过132,000个人工Likert量表标注
评估体系
- 评估维度:
- 基础对话
- 角色扮演
- 情感支持
- 评估指标:9个细粒度指标
- 附加指标:回答多样性整体评估
主要发现
- 表现最佳的LLM在角色扮演和情感支持方面超越人类粉丝
- 人类在回答多样性方面仍保持领先
研究价值
- 为优化LLM在情感支持角色扮演方面的研究提供资源和见解
搜集汇总
数据集介绍

构建方式
ChatAnime数据集的构建过程分为两个主要阶段:场景问题生成和响应收集。首先,研究团队精心挑选了20个来自全球知名动漫社区的顶级角色,并设计了60个以情感为中心的现实场景问题。随后,通过严格的全国选拔流程,筛选出40名具有深厚角色知识和丰富角色扮演经验的中国动漫爱好者。在此基础上,系统性地收集了10个大型语言模型(LLMs)和这40名爱好者的两轮对话数据。
特点
ChatAnime数据集作为首个情感支持角色扮演(ESRP)数据集,具有以下显著特点:1) 包含20个知名动漫角色和60个情感导向的现实场景;2) 收集了2,400条人工撰写和24,000条LLM生成的回答;3) 提供了超过132,000条人类Likert量表标注,涵盖细粒度质量评分和多样性评估;4) 设计了包含9个细粒度指标的三维评估体系(基础对话、角色扮演和情感支持),并包含整体响应多样性指标。
使用方法
使用ChatAnime数据集时,研究者可以:1) 通过两轮对话场景评估LLMs在角色扮演和情感支持方面的表现;2) 利用细粒度评分系统(包含一致性、流畅性、角色知识等9个指标)进行多维度模型评估;3) 比较人类和LLMs在情感支持角色扮演任务中的表现差异;4) 分析响应多样性指标与核心能力之间的关系;5) 作为训练数据优化LLMs在情感陪伴场景中的表现。数据集特别适用于研究虚拟角色如何结合特定性格特征提供情感支持。
背景与挑战
背景概述
ChatAnime数据集由上海Qi Zhi研究所、清华大学和北京大学的研究团队于2025年8月首次提出,是首个专注于动漫角色情感支持角色扮演(ESRP)的中文对话数据集。该数据集旨在评估大型语言模型(LLMs)在保持角色特质的同时提供情感支持的能力。研究团队精选了20个全球知名动漫角色,设计了60个情感导向的现实场景问题,并通过全国范围筛选出40名资深动漫爱好者参与数据收集。ChatAnime包含2,400条人工撰写和24,000条LLM生成的回答,辅以超过132,000条人工标注,为虚拟角色情感交互研究提供了重要基准。该数据集创新性地将角色扮演与情感支持相结合,推动了娱乐型AI向情感陪伴领域的发展。
当前挑战
ChatAnime面临的挑战主要体现在两个方面:在领域问题层面,需解决虚拟角色如何突破娱乐功能局限,在真实生活场景中提供个性化情感支持的难题,这要求模型兼具角色一致性识别和复杂情感需求理解能力;在构建过程中,研究团队需克服角色知识准确性(避免角色背景虚构)、多维度评估体系设计(平衡角色扮演与情感支持指标)以及文化特异性处理(针对中文语境优化)等挑战。此外,数据收集阶段需确保40名筛选的动漫爱好者能精准把握角色特质,同时维持对话情感价值的专业性,这对参与者选拔和培训提出了极高要求。
常用场景
经典使用场景
ChatAnime数据集在情感支持角色扮演(ESRP)研究中具有经典的应用场景。该数据集通过模拟真实世界中的情感支持对话,评估大型语言模型(LLMs)在扮演动漫角色时提供情感支持的能力。研究者和开发者可以利用该数据集来训练和评估模型在角色扮演和情感支持方面的表现,特别是在需要结合角色特质和情感支持的复杂对话场景中。
实际应用
在实际应用中,ChatAnime数据集可用于开发虚拟角色陪伴系统,特别是在心理健康支持和日常陪伴场景中。通过模拟动漫角色与用户的情感互动,该系统可以帮助用户缓解压力、提供情感支持,并增强用户的情绪管理能力。此外,该数据集还可用于游戏和娱乐产业,提升虚拟角色的互动体验。
衍生相关工作
ChatAnime数据集衍生了一系列相关研究,包括角色扮演模型的优化、情感支持对话系统的设计,以及多模态情感支持系统的开发。例如,一些研究利用该数据集探索了如何通过强化学习提升模型在角色扮演中的一致性,另一些研究则专注于结合视觉和听觉模态,以提供更沉浸式的情感支持体验。
以上内容由遇见数据集搜集并总结生成



