five

ETRI KEMDy19|情感分析数据集|多模态数据集

收藏
github2024-05-17 更新2024-05-31 收录
情感分析
多模态
下载链接:
https://github.com/DimensionSTP/multimodal-transformer
下载链接
链接失效反馈
资源简介:
ETRI KEMDy19数据集用于多模态情感分析任务,支持音频和文本模态的训练和测试。

The ETRI KEMDy19 dataset is utilized for multimodal emotion analysis tasks, supporting training and testing across audio and text modalities.
创建时间:
2022-05-06
原始信息汇总

数据集概述

数据集名称

  • ETRI KEMDy19

数据集用途

  • 用于2022 ETRI多模态情感分类论文竞赛。

数据集操作指南

单模态训练

  • 音频模态: shell python unimodal_main.py mode=audio dataset=audio_kemdy19_dataset

  • 文本模态: shell python unimodal_main.py mode=text dataset=text_kemdy19_dataset

多模态模型超参数调优

  • 多模态变换器(嵌入向量深度融合): shell python main.py mode=tune is_tuned=untuned num_trials={num_trials}

多模态训练

  • 多模态变换器(嵌入向量深度融合): shell python main.py mode=train is_tuned={tuned or untuned} num_trials={num_trials}

多模态测试

  • 多模态变换器(嵌入向量深度融合): shell python main.py mode=test is_tuned={tuned or untuned} num_trials={num_trials} epoch={ckpt epoch}

多模态预测

  • 端到端: shell python main.py mode=predict is_tuned={tuned or untuned} num_trials={num_trials} epoch={ckpt epoch}
AI搜集汇总
数据集介绍
main_image_url
构建方式
ETRI KEMDy19数据集的构建基于多模态情感分类的需求,整合了音频和文本两种模态的数据。该数据集通过精心设计的实验流程,收集了大量情感相关的音频和文本样本,并进行了细致的标注工作,确保了数据的高质量和多样性。
使用方法
使用ETRI KEMDy19数据集时,研究者可以通过单模态或双模态的方式进行训练和测试。单模态训练可分别针对音频或文本进行,而多模态训练则结合了两种模态的数据。通过提供的脚本,用户可以方便地进行模型训练、测试和预测,同时支持超参数调优和多轮实验。
背景与挑战
背景概述
ETRI KEMDy19数据集是由韩国电子通信研究院(ETRI)在2022年发布的,专门用于多模态情感分类研究。该数据集的创建旨在推动情感计算领域的发展,特别是通过结合音频和文本数据来提高情感分类的准确性。ETRI KEMDy19数据集的核心研究问题是如何有效地融合多模态信息,以提升情感识别的性能。这一研究不仅对学术界具有重要意义,也为工业界提供了新的技术支持,特别是在人机交互和情感智能应用领域。
当前挑战
ETRI KEMDy19数据集在构建过程中面临了多重挑战。首先,多模态数据的融合是一个复杂的过程,需要解决不同模态数据之间的异质性和不一致性问题。其次,情感分类的准确性依赖于高质量的标注数据,而情感的标注本身具有主观性和复杂性,这增加了数据集构建的难度。此外,如何在保持数据多样性的同时确保数据的质量和一致性,也是该数据集面临的重要挑战。这些挑战不仅影响了数据集的构建,也对后续的研究和应用提出了更高的要求。
常用场景
经典使用场景
ETRI KEMDy19数据集在情感分类任务中展现了其经典应用价值。通过结合音频和文本的多模态信息,该数据集支持了多模态Transformer模型的训练与评估,特别是在情感识别和分类领域。研究者可以利用该数据集进行单模态(如仅音频或仅文本)和多模态(音频与文本结合)的情感分析实验,从而深入探索不同模态对情感识别的影响。
解决学术问题
ETRI KEMDy19数据集为解决多模态情感识别中的关键学术问题提供了有力支持。它不仅帮助研究者验证多模态融合技术的有效性,还促进了情感计算领域的发展。通过该数据集,研究者能够探索如何更精确地从音频和文本中提取情感特征,并解决多模态数据融合中的挑战,如模态间的信息互补与冲突问题。
实际应用
在实际应用中,ETRI KEMDy19数据集为情感识别技术在多个领域提供了广泛的应用场景。例如,在智能客服系统中,通过分析用户的语音和文本信息,系统可以更准确地识别用户的情感状态,从而提供更个性化的服务。此外,该数据集还可用于心理健康监测、教育评估等领域,帮助实现情感智能的自动化和精细化。
数据集最近研究
最新研究方向
在情感计算领域,ETRI KEMDy19数据集的最新研究方向主要集中在多模态情感分类上。该数据集通过整合音频和文本数据,推动了多模态Transformer模型的应用与发展。研究者们致力于通过深度融合嵌入向量,优化模型的情感识别能力,特别是在超参数调优和多模态训练方面取得了显著进展。这些研究不仅提升了情感分类的准确性,还为跨模态情感分析提供了新的视角,对人工智能在情感智能领域的应用具有重要意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录