ERIT
收藏arXiv2024-07-25 更新2024-07-27 收录
下载链接:
https://zenodo.org/record/12803448
下载链接
链接失效反馈官方服务:
资源简介:
ERIT数据集由香港科技大学电子与计算机工程系创建,旨在促进轻量级多模态融合研究。该数据集包含来自老年人视频的文本和图像数据,每个样本带有七种情绪标签。数据集内容丰富,包括多种情绪表达和个体差异,适用于训练和评估老年人情绪识别模型。数据集的创建过程包括从视频中提取帧、使用自动语音识别进行文本转录以及通过DeepFace框架进行情绪标签验证。ERIT数据集主要应用于老年人情绪识别、医疗保健和辅助技术等领域,旨在解决老年人情绪识别的准确性和鲁棒性问题。
The ERIT dataset was created by the Department of Electronic and Computer Engineering at The Hong Kong University of Science and Technology, aiming to promote research on lightweight multimodal fusion. This dataset includes text and image data sourced from videos of elderly individuals, with each sample annotated with seven emotion labels. Featuring rich content covering diverse emotional expressions and individual differences, the dataset is applicable for training and evaluating emotion recognition models for elderly populations. The dataset construction process involves three main procedures: extracting frames from the original videos, conducting text transcription via automatic speech recognition (ASR), and verifying emotion labels using the DeepFace framework. The ERIT dataset is mainly applied in fields including elderly emotion recognition, healthcare, and assistive technologies, with the goal of resolving the issues of accuracy and robustness in elderly emotion recognition.
提供机构:
香港科技大学电子与计算机工程系
创建时间:
2024-07-25
搜集汇总
数据集介绍

构建方式
ERIT数据集的构建基于对老年人反应视频的 lightweight Multimodal 数据采集,包含文本和图像数据。该数据集由 ElderReact 视频数据集提取的帧构成,并为其提供了七种基本情绪标签:愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中立。构建过程中,采用自动语音识别技术对视频中的语音进行转录,并利用 DeepFace 框架对视频帧进行情绪标签的精准选取,从而确保了数据集的多样性和准确性。
特点
ERIT数据集的特点在于其 lightweight 的构建理念,适合于轻量级的多模态融合评估。它填补了情感识别领域中对老年人群体研究的空白,提供了针对老年人情感反应的自然情感标签,而非仅限于演员表情的数据库。此外,数据集的构建有助于促进对老年人情感识别的研究,以及多模态融合技术在情感识别中的应用。
使用方法
使用ERIT数据集时,研究者可以通过其提供的文本和图像数据来进行多模态融合的实验。该数据集适用于训练和评估针对老年人的情感识别模型,可以应用于医疗保健、老年人护理和辅助技术等多个领域。数据集的使用包括但不限于对多模态融合性能的研究,以及基于文本和图像的独立模态分析。
背景与挑战
背景概述
在人工智能与情感识别领域,ERIT数据集的构建标志着对老年人群情感识别研究的深化。该数据集由香港科技大学电子与计算机工程系的Rita Frieske和Bertram E. Shi等于近期创建,旨在促进轻量级多模态融合研究,并解决面向老年人情感识别系统的需求。ERIT数据集包含文本和图像数据,这些数据是从老年人在不同情境下反应的视频中收集而来,并伴有七种情感标签,为机器学习在视觉情感识别方面的研究提供了一个鲜少关注的年龄群体的数据资源。
当前挑战
ERIT数据集在构建过程中面临了多个挑战:首先是老年人情感表达的多样性和复杂性,这要求数据集在标注和融合多模态信息时具备高准确性;其次,数据集的构建需要解决不同模态数据之间的同步和融合问题,特别是在文本和图像信息的处理上;最后,由于目前针对老年人情感识别的研究尚不充分,该数据集的创建还需考虑到如何填补这一研究空白,并提供一个适用于多模态融合评估的基准。
常用场景
经典使用场景
ERIT数据集是一款轻量级的多模态数据集,专为评估轻量级多模态融合而设计。其经典使用场景在于,通过文本和图像两种模态的数据,对老年人的情感进行识别和分析。该数据集包含了对视频中的老年人情感反应的标注,使得研究者能够在此基础上训练和评估情感识别模型,进而改善人机交互体验,尤其是针对老年人这一特殊群体的交互体验。
实际应用
在实际应用中,ERIT数据集可被用于开发针对老年人的辅助技术,如智能家居系统、健康监测设备和情感交互机器人等。这些技术能够根据老年人的情感状态提供个性化服务,从而提升老年人的生活质量,并在医疗保健、老年护理等领域发挥重要作用。
衍生相关工作
基于ERIT数据集,研究者们已经开展了一系列相关工作,包括但不限于开发新的情感识别模型、提出更有效的多模态融合方法以及构建面向老年人情感识别的应用原型。这些衍生工作进一步拓展了ERIT数据集的应用范围,推动了情感识别技术在老年人群体中的实际应用。
以上内容由遇见数据集搜集并总结生成



