five

EMER-Coarse|情感识别数据集|人机交互数据集

收藏
arXiv2024-07-10 更新2024-07-11 收录
情感识别
人机交互
下载链接:
https://github.com/zeroQiaoba/AffectGPT
下载链接
链接失效反馈
资源简介:
EMER-Coarse数据集由中国科学院自动化研究所构建,专注于可解释的多模态情感识别任务。该数据集包含115,595个样本,基于MER2024-SEMI数据集,涵盖了大量以人为中心的视频。数据集的创建过程中,采用了简化的标注流程和开源模型,以降低人工检查和闭源模型的依赖。EMER-Coarse数据集主要用于提高情感识别的准确性和可靠性,特别是在人机交互领域的应用。
提供机构:
中国科学院自动化研究所
创建时间:
2024-07-10
原始信息汇总

EMER数据集

数据集构建

初始数据集

  • 来源:从MER 2023数据集中选取样本。
  • 下载方式:需填写EULA并发送到lianzheng2016@ia.ac.cn。

EMER-V1

  • 样本数量:100个非中性样本。
  • 详细信息:详见arXiv论文
  • 数据位置./EMER/dataset-v1

EMER-V2

  • 样本数量:332个样本。
  • 注释方法:使用GPT-4V进行初始注释,结合人工检查和ChatGPT的推理能力。
  • 详细信息:详见arXiv论文
  • 数据位置./EMER/dataset-v2

AffectGPT

  • 目标:训练一个音频-视频-文本对齐模型,用于可解释的多模态情感推理。
  • 实现:基于Video-LLaMA进行修改,支持音频-视频-文本对齐训练。
  • 代码位置./AffectGPT
  • 当前支持:仅提供使用EMER-V1数据集进行训练的代码。
  • 更多实验结果:详见arXiv论文
AI搜集汇总
数据集介绍
main_image_url
构建方式
EMER-Coarse数据集的构建基于MER2024-SEMI,该数据集包含115,595个以人为中心的视频。构建过程中,研究团队简化了标注流程,避免了手动检查,并使用开源模型替代了闭源模型。具体步骤包括预标注音频和视频线索、去歧义字幕以及翻译以获得双语描述。通过这些自动化步骤,大幅降低了标注成本,从而构建了一个大规模的粗略标注数据集。
特点
EMER-Coarse数据集的主要特点是其大规模和粗略标注。该数据集包含115,595个样本,远超以往的数据集,足以支持监督训练。此外,数据集的构建过程中采用了开源模型,减少了对外部API的依赖,提高了数据集的可访问性和可扩展性。
使用方法
EMER-Coarse数据集主要用于训练多模态情感识别模型。研究者可以利用该数据集进行第一阶段的训练,学习多模态输入与情感相关描述之间的粗略映射。随后,可以使用精细标注的数据集(如EMER-Fine)进行第二阶段的训练,以进一步提高模型的准确性和可靠性。数据集的代码和样本已公开,便于后续研究者进行深入分析和应用。
背景与挑战
背景概述
在人机交互领域,情感识别是一项至关重要的研究课题。传统的情感识别方法通常依赖于固定的标签空间和有限的预测数量,这可能导致情感描述的不准确。为了解决这一问题,研究人员提出了可解释的多模态情感识别(EMER)任务,旨在通过多模态和多方面的线索,以开放词汇的方式预测情感,并提供预测的支持和证据。然而,由于高昂的标注成本,现有的数据集(如EMER-Fine)规模较小,难以支持监督训练。为此,中国科学院自动化研究所和清华大学等机构的研究人员于2024年创建了EMER-Coarse数据集,该数据集通过简化标注流程和使用开源模型,大幅降低了标注成本,并包含了大规模的样本,为EMER任务的研究提供了重要的数据支持。
当前挑战
EMER-Coarse数据集的构建面临多重挑战。首先,情感识别任务本身具有复杂性,情感的多样性和细微差别使得准确标注变得困难。其次,数据集的构建过程中,研究人员需要避免手动检查,转而依赖开源模型进行预标注、消歧和翻译,这要求开源模型在性能上接近甚至超越闭源模型。此外,尽管EMER-Coarse数据集规模较大,但其标注的粗略性可能导致数据质量的不稳定性,如何在保证数据规模的同时提高标注精度,是该数据集面临的另一大挑战。最后,如何有效地利用EMER-Coarse数据集进行模型训练,以实现情感识别任务的高效和准确,也是研究人员需要解决的关键问题。
常用场景
经典使用场景
EMER-Coarse数据集在多模态情感识别领域中被广泛用于训练和验证模型。其经典使用场景包括利用大规模的粗标签数据进行初步模型训练,随后通过精细标注的数据集进行微调,以提升情感识别的准确性和可靠性。这种两阶段的训练框架显著降低了标注成本,同时提高了模型的泛化能力。
衍生相关工作
基于EMER-Coarse数据集,研究人员开发了多种多模态情感识别模型和框架,如AffectGPT等。这些工作不仅提升了情感识别的准确性,还推动了多模态数据融合和处理技术的发展。此外,该数据集还激发了关于情感识别可解释性和透明度的研究,促进了情感识别技术在实际应用中的信任度和接受度。
数据集最近研究
最新研究方向
在人机交互领域,情感识别一直是研究的核心议题。近年来,随着多模态数据融合技术的进步,可解释的多模态情感识别(EMER)成为前沿研究方向。EMER-Coarse数据集的构建,通过简化标注流程和采用开源模型,显著降低了标注成本,并提供了大规模的样本数据,为深度学习模型的训练提供了坚实基础。研究者们提出的AffectGPT框架,通过两阶段训练策略,首先利用EMER-Coarse数据集进行粗略映射学习,然后使用精细标注的EMER-Fine数据集进行精确对齐,有效提升了情感识别的准确性和可靠性。这一研究不仅推动了情感识别技术的发展,也为多模态数据处理提供了新的思路和方法。
相关研究论文
  • 1
    AffectGPT: Dataset and Framework for Explainable Multimodal Emotion Recognition中国科学院自动化研究所 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

NCBI Bookshelf

Bookshelf provides free online access to books and documents in life science and healthcare. Search, read, and discover.

国家生物信息中心 收录

LogiQA

LogiQA 包含 8,678 个 QA 实例,涵盖多种类型的演绎推理。结果表明,最先进的神经模型的性能远远低于人类天花板。该数据集还可以作为在深度学习 NLP 设置下重新研究逻辑 AI 的基准。

OpenDataLab 收录

ActivityNet Captions

The ActivityNet Captions dataset is built on ActivityNet v1.3 which includes 20k YouTube untrimmed videos with 100k caption annotations. The videos are 120 seconds long on average. Most of the videos contain over 3 annotated events with corresponding start/end time and human-written sentences, which contain 13.5 words on average. The number of videos in train/validation/test split is 10024/4926/5044, respectively.

Papers with Code 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

马达加斯加岛 – 世界地理数据大百科辞条

马达加斯加岛在非洲的东南部,位于11o56′59″S - 25o36′25″S及43o11′18″E - 50o29′36″E之间。通过莫桑比克海峡与位于非洲大陆的莫桑比克相望,最近距离为415千米。临近的岛屿分别为西北部的科摩罗群岛、北部的塞舌尔群岛、东部的毛里求斯岛和留尼汪岛等。在google earth 2015年遥感影像基础上研发的马达加斯加海岸线数据集表明,马达加斯加岛面积591,128.68平方千米,其中马达加斯加本岛面积589,015.06平方千米,周边小岛面积为2,113.62平方千米。马达加斯加本岛是非洲第一大岛,是仅次于格陵兰、新几内亚岛和加里曼丹岛的世界第四大岛屿。岛的形状呈南北走向狭长纺锤形,南北向长1,572千米;南北窄,中部宽,最宽处达574千米。海岸线总长16,309.27千米, 其中马达加斯加本岛海岸线长10,899.03千米,周边小岛海岸线长5,410.24千米。马达加斯加岛属于马达加斯加共和国。全国共划分22个区,119个县。22个区分别为:阿那拉芒加区,第亚那区,上马齐亚特拉区,博爱尼区,阿齐那那那区,阿齐莫-安德列发那区,萨瓦区,伊达西区,法基南卡拉塔区,邦古拉法区,索非亚区,贝齐博卡区,梅拉基区,阿拉奥特拉-曼古罗区,阿那拉兰基罗富区,阿莫罗尼马尼亚区,法土法韦-非图韦那尼区,阿齐莫-阿齐那那那区,伊霍罗贝区,美那贝区,安德罗伊区和阿诺西区。首都安塔那那利佛(Antananarivo)位于岛屿的中东部。马达加斯加岛是由火山及喀斯特地貌为主。贯穿海岛的是巨大火山岩山体-察腊塔纳山,其主峰马鲁穆库特鲁山(Maromokotro)海拔2,876米,是全国最高峰。马达加斯加自然景观垂直地带性分异显著,是热带雨林和热带草原广布的地区。岛上大约有20多万种动植物,其中包括马达加斯加特有物种狐猴(Lemur catta)、马达加斯加国树猴面包树(Adansonia digitata L.)等。

国家对地观测科学数据中心 收录