SENSE-7

github2025-11-11 更新2025-11-14 收录

下载链接：

https://github.com/microsoft/sense-7

下载链接

链接失效反馈

官方服务：

资源简介：

SENSE-7数据集是一个用于测量人机对话中用户感知共情能力的数据集，包含7个维度的共情评分。数据集包含两个主要表格：Tasks表记录对话任务和前后对话元数据，包括参与者标识、AI模型版本、任务重要性评分、期望共情程度以及后任务体验评分；Messages表包含对话轮次和共情标注，包括消息顺序、时间偏移、角色、内容文本、整体共情评分以及7个维度的共情评分（情感、认知、响应、亲社会、兴趣、情境、关系）。

The SENSE-7 dataset is a dataset for measuring users' perceived empathy in human-computer dialogue, which includes empathy scores across 7 dimensions. The dataset comprises two primary tables: the Tasks table records dialogue tasks and pre- and post-conversation metadata, including participant identifiers, AI model version, task importance score, desired empathy level, and post-task experience score; the Messages table contains dialogue turns and empathy annotations, including message sequence, time offset, role, content text, overall empathy score, and 7-dimensional empathy scores (affective, cognitive, responsive, prosocial, interest, situational, relational).

创建时间：

2025-10-21

原始信息汇总

SENSE-7 数据集概述

基本信息

数据集名称：SENSE-7
官方论文：SENSE-7: Taxonomy and Dataset for Measuring User Perceptions of Empathy in Sustained Human-AI Conversations
论文链接：https://arxiv.org/abs/2509.16437
数据集文件：sense-7_dataset.xlsx
数据集卡片：https://github.com/microsoft/sense-7/blob/main/dataset_card.pdf
许可证：Community Data License Agreement – Permissive, Version 2.0 (CDLA-P 2.0)

数据集结构

数据集包含两个主要工作表：

Tasks 工作表

PID：参与者标识符
Model：AI助手使用的LLM版本
TaskId：唯一对话标识符
PreTaskChoice：对话前话题选择
PreTaskImportance：对话任务重要性评分（1=完全不重要；5=极其重要）
PreTaskDesiredEmpathy：期望共情程度评分（1=最低共情；3=高度共情）
PostTaskExperience_Successful：完成任务成功度评分（1=强烈不同意；5=强烈同意）
PostTaskExperience_Engaged：对话参与度评分（1=强烈不同意；5=强烈同意）
PostTaskExperience_PositiveInteraction：与AI积极互动评分（1=强烈不同意；5=强烈同意）
PostTaskExperience_UseAgain：再次使用AI意愿评分（1=强烈不同意；5=强烈同意）
PostTaskEmpathy_*：7个共情维度的对话后评分（1=强烈不同意；5=强烈同意）

Messages 工作表

MessageId：对话轮次顺序
TimeOffsetSeconds：对话开始后的秒数
Role：用户/助手角色
Content：消息文本
EmpathyOverall：每轮对话的总体共情评分（1=非常差；5=非常好）
7个维度评分：情感、认知、回应、亲社会、兴趣、情境、关系（1=非常差；5=非常好）

主要特征

数据规模：包含持续人机对话数据
标注维度：7个共情维度标注
评分体系：1-5级评分标准
时间信息：包含对话时间偏移信息

技术规格

文件格式：Excel (.xlsx)
数据类型：结构化对话数据与评分数据
标注粒度：轮次级别共情标注

联系方式

联系邮箱：sense7data@microsoft.com

搜集汇总

数据集介绍

构建方式

在人工智能交互研究领域，SENSE-7数据集的构建采用了系统性实证方法。该数据集通过收集真实用户与AI助手之间的持续对话记录，结合多维度的标注体系进行构建。具体而言，数据集包含两个核心工作表：Tasks表记录了参与者的人口学信息、对话任务元数据及前后测评分；Messages表则详细标注了每个对话轮次的内容，并采用七维度共情评估框架对每轮交互进行精细化评分，覆盖情感共鸣、认知理解、回应质量等关键层面。所有标注均基于标准化的心理学量表，确保了数据的科学性与可复现性。

特点

SENSE-7数据集展现出显著的多维特性与结构完整性。其核心特征体现在七维共情评估体系的创新构建，通过情感、认知、回应、亲社会性、兴趣、情境与关系七个独立维度全面刻画共情表现。数据集包含完整的对话链条与时间序列数据，同时整合了参与者主观体验的前后测评分，形成了多层级的数据结构。特别值得注意的是，该数据集采用均衡加权算法生成标准真值信号，有效避免了对话轮次长度差异带来的评估偏差，为研究长期人机交互中的共情动态提供了理想的数据基础。

使用方法

该数据集的使用遵循模块化分析流程，研究者可通过配套的Python脚本实现端到端的共情预测评估。使用流程起始于预测生成阶段，通过配置OpenAI API参数与提示模板，利用大型语言模型对对话轮次进行共情水平分类。随后进入评估阶段，系统自动计算包括准确率、宏F1分数、平均绝对误差等在内的多维度指标，并采用交叉验证策略确保结果稳健性。数据集支持自定义提示模板与真值信号配置，允许研究者根据具体需求调整评估框架，这种灵活的设计使其能够适应不同场景下的共情计算研究需求。

背景与挑战

背景概述

SENSE-7数据集于2025年由微软研究院主导开发，旨在构建一个系统性评估人机对话中用户感知共情能力的标准化工具。该数据集基于多维度共情分类法，涵盖情感、认知、回应、亲社会、兴趣、情境和关系七个核心维度，通过结构化对话任务和精细化标注，为人工智能在心理健康支持、教育陪伴等领域的共情建模提供了关键基准。其创新性在于首次将用户主观感知与客观对话行为相结合，推动了人机交互研究从功能性向情感智能的范式转变。

当前挑战

在共情计算领域，量化主观情感体验存在信效度验证难题，SENSE-7需解决多维共情指标与用户真实感知的语义对齐问题。数据集构建过程中，标注一致性控制面临挑战，七维度评分需要克服人工标注者间差异性；同时，长程对话的语境依赖性和动态情感演变对共情标注的时序连贯性提出更高要求，需通过多轮迭代标注与交叉验证确保数据质量。

常用场景

衍生相关工作

围绕该数据集已衍生出多项创新研究，包括基于大语言模型的共情预测算法开发、跨文化语境下的共情表现比较分析，以及多模态共情识别方法的探索。这些工作不仅扩展了情感计算的研究边界，还促进了心理学理论与人工智能技术的深度融合，为构建更具人文关怀的智能系统开辟了新路径。

数据集最近研究