KardiaBench

github2025-12-04 更新2025-12-05 收录

下载链接：

https://github.com/JhCircle/Kardia-R1

下载链接

链接失效反馈

官方服务：

资源简介：

KardiaBench是一个大规模的情感对话数据集，专为以推理为中心的情感支持设计，包含22,080个多轮情感对话、671个完整记录的人物角色、细粒度的情感状态以及四跨度的结构化推理格式。数据集经过完全匿名化和清理。

KardiaBench is a large-scale emotional conversation dataset designed specifically for reasoning-centered emotional support. It contains 22,080 multi-turn emotional conversations, 671 fully documented character roles, fine-grained emotional states, and a four-span structured reasoning format. The dataset has been fully anonymized and cleaned.

创建时间：

2025-11-30

原始信息汇总

Kardia-R1 数据集概述

数据集基本信息

数据集名称: KardiaBench
发布机构/作者: 由 Kardia-R1 项目团队发布
发布日期: 2025年12月3日
论文链接: https://arxiv.org/abs/2512.01282
数据集访问地址: https://huggingface.co/datasets/Jhcircle/KadiaBench

数据集内容与规模

对话数量: 22,080 条共情多轮对话
人物角色数量: 671 个真实世界用户画像
数据特点: 包含细粒度情感状态，采用四跨度结构化推理格式，经过完全匿名化和清洗处理。

数据结构与字段

数据集包含以下核心字段：

字段名	描述
person	完整的原始用户画像字符串，包括 MBTI、关于、签名和近期活动。
mbti	从画像中提取的用户 MBTI 类型（例如，“INFP”、“ISTP”）。
emotion	目标情感状态，代表用户在场景中的当前感受（例如，“焦虑”、“恐惧”）。
situation	对话开始的背景上下文或情感场景。
anon_username	用于保护隐私的匿名化用户名。
messages	完整的结构化对话，作为消息对象列表，包括系统提示、用户轮次和助手回复。

数据集特色与框架

核心框架: Kardia-R1，一个以推理为中心的共情对话框架，统一了“用户理解 → 情感推理 → 安全、支持性回应”。
结构化认知: 采用四跨度结构化格式：
- <|understanding_begin|>...<|understanding_end|>：利用角色和上下文解释用户意图和情感。
- <|reasoning_begin|>...<|reasoning_end|>：执行内部评估和共情推理。
- <|emotion_begin|>...<|emotion_end|>：识别正确的细粒度情感标签。
- <|response_begin|>...<|response_end|>：生成支持性的、与角色一致的共情回复。
训练方法: 采用“准则即裁判”的强化学习，具有可解释、基于标准、由大语言模型评判的特点。

数据集用途与性能

设计目的: 用于以推理为中心的情感支持研究。
验证性能: 基于该数据集训练的 Kardia-R1 框架在情感准确性和共情质量上优于 GPT-4o、DeepSeek-R1、PsyLLM 等先进模型，并在所有共情维度上取得一致提升。
模型兼容性: 可扩展至 Qwen (3B/7B) 和 Gemma (2B/7B) 等骨干模型。

数据获取与使用

访问方式: 需要在 HuggingFace 上提交访问请求，描述预期用途，经维护者批准后方可获取。
加载代码示例: python from datasets import load_dataset dataset = load_dataset("Jhcircle/KadiaBench")
认证提示: 若遇到访问被拒错误，需检查 HuggingFace 认证或等待请求批准。可使用 huggingface-cli login 登录。

引用信息

若使用本数据集，请引用： bibtex @article{yuan2025kardia, title={Kardia-R1: Unleashing LLMs to Reason toward Understanding and Empathy for Emotional Support via Rubric-as-Judge Reinforcement Learning}, author={Yuan, Jiahao and Cui, Zhiqing and Wang, Hanqing and Gao, Yuansheng and Zhou, Yucheng and Naseem, Usman}, journal={arXiv preprint arXiv:2512.01282}, year={2025} }

搜集汇总

数据集介绍

构建方式

在情感计算与对话系统领域，构建高质量数据集是推动模型具备共情能力的关键。KardiaBench数据集的构建过程体现了严谨的学术方法，其核心基于从公开社区收集的671个真实用户画像，这些画像包含了MBTI人格类型、个人简介与近期活动等多维度信息。以此为基础，研究团队通过精心设计的流程生成了22,080轮多轮共情对话，每段对话均严格遵循四段式结构化认知框架进行标注，涵盖了从理解用户意图、内部评估与共情推理、细粒度情感识别到生成支持性回应的完整链条。整个数据集经过彻底的匿名化与清洗处理，确保了数据的可用性与伦理合规性。

特点

该数据集在情感支持对话研究领域展现出若干鲜明特征。其首要特点在于引入了创新的四段式结构化认知格式，通过特定的标签明确划分了理解、推理、情感识别与回应生成四个认知阶段，为模型的可解释性与可控性提供了结构化基础。其次，数据集紧密耦合了丰富的用户画像与细粒度的情感状态，使得对话情境具备深厚的个性与情感背景。此外，数据规模庞大且覆盖了多样化的真实人格与情感场景，为模型训练提供了充分的泛化素材。这些特征共同使KardiaBench成为一个专注于推理驱动型共情、兼具规模与深度的基准数据集。

使用方法

对于研究人员而言，使用KardiaBench数据集需遵循其访问协议。数据集托管于HuggingFace平台，使用者需首先提交访问申请并说明研究用途，在获得批准后方可加载。通过标准的`datasets`库并调用`load_dataset`函数即可获取数据，加载前需确保已完成HuggingFace的身份认证。数据以字典形式组织，关键字段包括完整的用户画像、提取的MBTI类型、目标情感状态、对话起始情境、匿名用户名以及结构化的多轮消息列表。该数据集主要适用于训练与评估具备共情推理能力的大型语言模型，尤其可用于研究基于准则的强化学习、可控共情生成以及人格一致性对话等前沿方向。

背景与挑战

背景概述

在人工智能与心理学交叉领域，共情对话系统的研究致力于赋予大型语言模型理解与关怀人类情感的能力。KardiaBench数据集于2025年12月由研究团队正式发布，作为Kardia-R1框架的核心组成部分，其构建旨在推动模型在情感支持任务中进行结构化推理。该数据集包含22,080轮多轮对话与671个真实用户画像，通过四跨度认知结构引导模型完成从用户意图理解到情感回应的完整推理链条。KardiaBench的建立标志着共情计算从简单响应生成迈向深度、可解释的情感推理，为可控制、透明化的共情人工智能提供了关键数据基础。

当前挑战

在情感计算领域，构建能够精准理解复杂人类情感并生成安全、一致且个性化支持回应的系统，长期面临共情深度与可解释性不足的挑战。KardiaBench针对此，需解决细粒度情感状态分类、多轮对话中情绪动态演变建模，以及用户画像与回应间的一致性保持等难题。在数据集构建过程中，挑战同样显著：大规模高质量共情对话的采集与标注耗费巨大人力；为确保隐私伦理，用户个人信息需进行彻底匿名化处理；此外，设计结构化认知格式以同时涵盖理解、推理、情感识别与回应生成，要求在多维度标注间取得精细平衡。

常用场景

经典使用场景

在情感计算与对话系统领域，KardiaBench数据集为大型语言模型提供了深度理解与共情推理的训练基准。其经典使用场景集中于模型的多轮共情对话生成与评估，研究者利用数据集内包含的671个真实用户画像与超过2.2万轮结构化对话，系统性地训练模型进行用户意图解析、情感状态识别以及人格一致性回应生成。通过四段式认知框架，模型能够模拟人类助人者从理解到回应的完整推理链条，从而在可控、透明的环境下提升对话的共情质量与安全性。

衍生相关工作

围绕KardiaBench数据集，已衍生出一系列专注于可解释共情推理的经典研究工作。其中，与其配套提出的Kardia-R1框架利用准则即裁判的强化学习方法，在多个骨干模型上实现了共情指标的显著提升。该工作进一步激发了学术界对透明化情感推理、人格对齐机制以及安全共情生成的探索，例如基于结构化认知的对话模型优化、多维度共情评估体系的构建，以及将类似准则驱动范式迁移至其他社会心理任务的研究，共同推动了情感智能领域向更严谨、更可评估的方向发展。

数据集最近研究