five

MER2025_personality|情感识别数据集|人格识别数据集

收藏
huggingface2025-04-23 更新2025-04-24 收录
情感识别
人格识别
下载链接:
https://huggingface.co/datasets/MDPEdataset/MER2025_personality
下载链接
链接失效反馈
资源简介:
MER2025_personality数据集是MDPE数据集的一个子集,用于ACM MM的MER25挑战的情感增强人格识别跟踪任务的测试集。MDPE是一个包含个人差异信息,如人格和情感表达特征的多模态欺骗数据集,支持欺骗检测以及人格识别和情感识别等任务。
创建时间:
2025-04-21
AI搜集汇总
数据集介绍
main_image_url
构建方式
MER2025_personality数据集作为MDPE数据集的子集,其构建过程体现了多模态数据融合的前沿理念。该数据集源自MDPE这一综合性多模态欺骗检测数据库,通过精心筛选和标准化处理,保留了原始数据中的人格特征标签,同时确保了数据分布的科学性。研究人员采用严格的伦理审查流程,所有数据均需通过签署终端用户许可协议获取,体现了对隐私保护的重视。
特点
该数据集最显著的特点在于其多维度的信息集成,不仅包含传统的人格特征标注,还融合了情感表达等多模态特征。作为ACM MM会议竞赛指定测试集,其数据质量经过严格验证,具有较高的信效度。与同类数据集相比,MER2025_personality特别强调人格特征与情感特征的关联性分析,为心理学计算研究提供了独特的数据支持。
使用方法
使用该数据集需遵循严格的访问流程,研究者需签署EULA协议并向指定邮箱提交申请。数据集主要应用于人格计算、情感识别等跨学科研究领域,特别适合作为多模态机器学习模型的验证基准。在具体应用中,建议结合原始MDPE数据集进行联合建模,以充分利用其训练集和验证集的互补优势。
背景与挑战
背景概述
MER2025_personality数据集作为MDPE数据集的子集,诞生于2024年,由跨学科研究团队在ACM多媒体大会的框架下构建。该数据集聚焦于多模态人格识别这一前沿课题,通过整合面部表情、语音韵律和文本特征等多维数据,为情感增强型人格识别研究提供了标准化测试基准。其母数据集MDPE的创新性在于同时囊括了欺骗行为特征与个体差异信息,使得研究者能够探索人格特质、情绪表达与欺骗行为之间的复杂关联,推动了社会认知计算领域的范式革新。核心贡献者Cai Cong等人在arXiv预印本论文中系统阐述了该数据集的理论框架与技术路线,标志着多模态人格计算开始从单一特征分析向交叉维度建模转变。
当前挑战
该数据集面临的核心挑战体现在算法与数据两个维度。在算法层面,多模态人格识别需要解决跨模态特征融合的难题,如何有效协调视觉、听觉和文本模态间的信息互补与冲突,成为模型性能突破的关键瓶颈。数据层面则存在标注一致性挑战,人格特质作为主观心理构念,其标注过程易受文化背景和评估标准影响,MER2025_personality虽经标准化处理,仍难以完全消除评分者间变异。构建过程中的技术挑战尤为突出,包括万兆级多模态数据的时空对齐、隐私保护下的生物特征脱敏,以及欺骗场景下真实情绪表达的捕捉困难,这些因素共同构成了该领域研究的实质性障碍。
常用场景
经典使用场景
在多媒体情感计算领域,MER2025_personality数据集作为MDPE的子集,为研究人格特质与情感表达之间的关联提供了重要实验平台。该数据集特别适用于多模态人格识别任务,通过整合视觉、语音和文本等多维度特征,支持研究者探索人格特质在跨模态交互中的表征规律。其标注数据经过标准化处理,确保了不同模态特征间的一致性,为构建鲁棒的人格识别模型奠定了基础。
实际应用
在智能客服系统开发中,该数据集支持构建具有人格感知能力的对话引擎,通过分析用户的多模态行为特征实现个性化响应。司法审讯辅助系统利用其欺骗检测与人格分析的双重功能,提升了对陈述真实性的判断准确度。教育科技领域则应用该数据集开发适应性学习系统,根据学习者的人格特征调整教学策略,显著提升了在线教育的交互质量。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

UCI Wine

UCI Wine数据集包含了178个样本,每个样本有13个特征,用于分类任务。这些特征包括葡萄酒的化学成分,如酒精含量、苹果酸、灰分等。数据集的目标是将葡萄酒分类为三个不同的品种。

archive.ics.uci.edu 收录