five

EXPRESS (EXperiences and PRocessed Emotions in Self-disclosure Stories)

收藏
arXiv2025-09-12 更新2025-11-24 收录
下载链接:
https://github.com/Computing-for-Social-Good-CSG/express-emotion-recognition
下载链接
链接失效反馈
官方服务:
资源简介:
EXPRESS是一个包含33679个人类经验和相关自我披露情感的基准数据集。该数据集从Reddit社区中收集,旨在评估大型语言模型(LLM)在细粒度情绪识别方面的能力。与现有研究通常将情绪分类到预定义的有限类别中不同,EXPRESS数据集包含251个细粒度的、自我披露的情绪标签,并通过分解成10个基本情绪维度和2个情绪维度,使得模型能够更精确地比较预测情绪和自我披露情绪。该数据集为评估LLM的情绪识别能力提供了一个新的基准,并为未来研究提供了有价值的见解。

EXPRESS is a benchmark dataset consisting of 33,679 human experiences paired with their corresponding self-disclosed emotions. Collected from the Reddit community, this dataset is intended to evaluate the fine-grained emotion recognition performance of Large Language Models (LLMs). Distinct from existing studies that typically classify emotions into a finite number of predefined categories, the EXPRESS dataset features 251 fine-grained, self-disclosed emotion labels. It decomposes emotions into 10 basic emotion dimensions and 2 additional emotion dimensions, allowing models to precisely compare predicted emotions against self-disclosed emotional states. This dataset provides a novel benchmark for assessing LLMs' emotion recognition capabilities and offers valuable insights for future research.
提供机构:
东北大学, 加州大学圣地亚哥分校, 马萨诸塞大学阿默斯特分校
创建时间:
2025-09-12
搜集汇总
数据集介绍
main_image_url
构建方式
在情感计算研究领域,构建具有生态效度的数据集对评估模型细粒度情感识别能力至关重要。EXPRESS数据集通过系统化流程从Reddit平台采集33,679条自我披露的情感经历,采用基于伯克利情绪词表的正则表达式模式匹配算法,精准定位文本中自我报告的情感词汇并将其替换为掩码标记。为确保模型输入标准化,研究团队依据语义完整性将长文本分割为512词元的片段,最终形成包含251种细粒度情感标签的大规模评测基准。
特点
该数据集在情感计算领域展现出显著特性:其文本平均长度达259词,突破了传统情感数据集的短文本限制,为模型理解复杂情感语境提供丰富背景。覆盖251种细粒度情感标签的设计,超越了传统基础情绪分类框架,能捕捉人类情感表达的微妙差异。采用自我披露情感作为真实标签的范式,有效规避了外部标注引入的主观偏差,确保了情感标注的生态效度与内在一致性。
使用方法
在情感智能评估实践中,研究者可通过掩码填充任务检验模型性能:将包含掩码标记的文本输入语言模型,要求其基于上下文预测原始情感词汇。评测体系采用多维度指标,包括词汇准确率、基于普拉奇克情绪轮分解的向量匹配度,以及结合情境理解能力的综合评估。支持零样本、小样本及思维链等多种提示策略,为探究模型情感推理机制提供灵活实验框架。
背景与挑战
背景概述
EXPRESS数据集由东北大学、加州大学圣地亚哥分校等机构研究人员于2025年联合创建,旨在解决大语言模型在细粒度情感识别领域的关键挑战。该数据集基于Reddit平台收集的33,679条自我披露式情感表达文本,涵盖251种精细情感标签,突破了传统情感分类任务中预设类别有限的瓶颈。通过结合普拉奇克情绪轮盘等经典情感理论构建评估框架,该数据集为探究语言模型与人类情感表达的深层对齐机制提供了重要基准,对心理健康辅助系统和情感计算领域具有显著推动力。
当前挑战
在解决细粒度情感识别任务时,EXPRESS面临双重挑战:领域问题层面,模型需从复杂语境中捕捉人类自我披露情感的微妙差异,但实验显示即使最优模型在基本情感维度上的错误率仍达65%;构建过程层面,需设计精准的情感词掩码算法以区分主体情感表达与客观描述,同时处理长文本分割与多情感词共现的技术难题,并确保自我披露标签在生态效度与理论一致性间的平衡。
常用场景
经典使用场景
在情感计算与自然语言处理领域,EXPRESS数据集作为细粒度情感识别的基准工具,广泛应用于评估大型语言模型对人类自我披露情感的捕捉能力。其独特之处在于通过从Reddit平台收集的真实长文本自我叙述,构建了包含251种情感标签的丰富语料库,为模型提供了模拟真实对话场景的测试环境。研究者通常利用该数据集的情感掩码任务,系统检验模型在复杂语境下对细微情感差异的识别精度,尤其在心理健康辅助诊断和情感对话系统的开发中具有重要价值。
实际应用
在现实应用层面,EXPRESS数据集为心理健康监测与情感支持系统提供了关键技术支持。基于该数据集训练的模型可应用于在线心理辅导平台,通过分析用户自述文本中的情感线索实现早期抑郁倾向预警。此外,在智能客服领域,该数据集助力开发具有情感感知能力的对话系统,使其能更精准地识别用户投诉中的愤怒情绪或咨询中的焦虑状态。社交媒体内容审核也可借助该数据集构建情感过滤机制,自动识别具有自我伤害倾向的情感表达并及时干预。
衍生相关工作
该数据集已催生多项创新性研究,例如基于EXPRESS的跨模型情感对齐分析揭示了不同架构语言模型在情感识别任务中的性能差异。部分研究团队利用该数据集开发了Mental-RoBERTa等心理健康领域专用模型,通过领域自适应训练提升情感识别效果。另有工作探索了少样本学习与思维链提示在情感任务中的适用性边界,发现相似情境示例能显著提升模型表现。这些衍生研究共同推动了情感计算领域向更细粒度、更符合人类情感表达规律的方向发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作