five

PA_IEMOCAP

收藏
github2025-11-25 更新2025-11-29 收录
下载链接:
https://github.com/Kyoto-University-Speech-and-Audio/PA-IEMOCAP
下载链接
链接失效反馈
官方服务:
资源简介:
PA_IEMOCAP数据集包含IEMOCAP数据集的个性标签,其中tipi_labels.csv文件包含6位注释者的原始TIPI注释,ocean.csv文件包含IEMOCAP数据集中每个发言者的处理后的OCEAN标签

The PA_IEMOCAP dataset includes personality labels for the IEMOCAP dataset. Specifically, the tipi_labels.csv file contains the raw TIPI annotations from six annotators, whereas the ocean.csv file stores the processed OCEAN personality labels for each speaker in the IEMOCAP dataset.
创建时间:
2025-11-25
原始信息汇总

PA-IEMOCAP 数据集概述

数据集简介

PA-IEMOCAP 数据集提供 IEMOCAP 数据集中的人格标签。

文件内容

  • tipi_labels.csv:包含 6 位标注者的原始 TIPI 注释。
  • ocean.csv:包含 IEMOCAP 数据集中每位发言者的处理后 OCEAN 标签。

相关资源

处理代码及其他资源可在 https://github.com/gitgaviny/IEMOCAP_personality 获取。

搜集汇总
数据集介绍
main_image_url
构建方式
在情感计算与语音分析领域,PA_IEMOCAP数据集的构建依托于IEMOCAP这一经典多模态情感语料库。该数据集通过整合六位标注者对TIPI人格量表的原始标注,并运用系统化处理流程将原始评分转化为OCEAN人格特质维度。构建过程中严格遵循心理学量表标准化原则,确保每位说话者的人格标签均基于多轮独立标注与一致性校验,最终形成结构化的OCEAN人格特征矩阵。
特点
作为情感计算研究的重要延伸,该数据集最显著的特点在于将离散的情感表达与连续的人格特质维度相融合。其核心价值体现在提供经过量化的OCEAN人格五因素模型标签,涵盖开放性、尽责性、外向性、宜人性及神经质五个维度。数据组织形式兼顾原始TIPI标注的透明性与处理后OCEAN标签的实用性,为探究人格特质与情感表达的内在关联提供了精准的量化依据。
使用方法
在跨学科研究实践中,使用者可通过关联人格标签与IEMOCAP原始数据中的语音、文本及视觉模态展开多维度分析。典型应用场景包括构建人格感知预测模型、探索人格特质与情感表达风格的关联性研究。研究人员可借助配套开源代码实现数据预处理与特征融合,建议优先采用分层交叉验证策略以确保模型评估的稳健性,充分发挥多模态数据与人格标签的协同价值。
背景与挑战
背景概述
PA_IEMOCAP数据集作为IEMOCAP多模态情感识别数据库的重要扩展,由研究团队于2020年前后构建,旨在探索人格特质与情感表达之间的深层关联。该数据集通过引入TIPI(Ten-Item Personality Inventory)和OCEAN(大五人格模型)标注体系,为情感计算领域提供了首个系统化的人格-情感交叉分析框架,显著推动了人机交互中个性化情感建模的发展。
当前挑战
人格标注任务面临主观性偏差的固有难题,六名标注者对同一语音片段的人格评估常出现显著分歧。在数据处理阶段,原始TIPI离散评分向连续OCEAN维度的转化过程需解决量表等效性问题,而跨模态对齐则要求严格保证人格标签与音频、文本、视频数据的时序同步,这些技术难点直接影响了人格-情感关联模型的泛化能力。
常用场景
经典使用场景
在情感计算与人机交互领域,PA_IEMOCAP数据集通过整合IEMOCAP的情感标注与人格特质标签,为多模态情感分析提供了关键支撑。研究者常利用该数据集构建人格感知的情感识别模型,探索语音、文本和面部表情等模态如何受个体人格差异影响,从而深化对情感表达复杂性的理解。
衍生相关工作
基于PA_IEMOCAP衍生的经典研究包括人格嵌入的情感识别框架与多模态融合算法。例如,GitHub开源项目IEMOCAP_personality提供了人格标签处理流程,启发了后续工作如人格自适应对话系统;此外,OCEAN标签被用于联合训练情感分类器,催生了在虚拟助手与教育技术中的个性化交互应用。
数据集最近研究
最新研究方向
在情感计算与人机交互领域,PA_IEMOCAP数据集的引入推动了人格特质与情感表达关联性的前沿探索。该数据集通过整合TIPI和OCEAN人格标注,为多模态情感分析提供了深层心理维度支持,当前研究热点集中于利用人格特征提升语音与文本情感识别模型的解释性。例如,结合大语言模型分析人格对对话动态的影响,已成为改善虚拟助手自然性的关键方向,这一进展不仅深化了情感智能的理论框架,还为个性化交互系统设计奠定了实证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作