five

RAVDESS|情感识别数据集|语音处理数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
情感识别
语音处理
下载链接:
https://opendatalab.org.cn/OpenDataLab/RAVDESS
下载链接
链接失效反馈
资源简介:
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
提供机构:
OpenDataLab
创建时间:
2023-04-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
RAVDESS数据集的构建基于对情感表达的细致分类和标准化录制。该数据集由24名专业演员参与,涵盖了8种基本情感(如愤怒、悲伤、喜悦等),每种情感通过两种性别和两种语言模式(口语和歌唱)进行表达。录制过程中,演员在标准化环境下进行表演,确保了数据的一致性和可靠性。此外,每段录音均附有详细的元数据,包括情感类别、性别、语言模式等信息,为后续研究提供了丰富的标注资源。
使用方法
RAVDESS数据集适用于多种情感识别和语音分析任务。研究者可以利用该数据集训练和验证情感分类模型,探索不同情感在语音特征上的表现差异。同时,数据集中的歌唱部分为音乐情感分析提供了独特的资源,有助于深入理解音乐与情感之间的关联。此外,RAVDESS数据集的详细元数据支持多维度分析,研究者可以根据性别、语言模式等条件进行细分研究,从而获得更精细的情感识别结果。
背景与挑战
背景概述
RAVDESS(Ryerson Audio-Visual Database of Emotional Speech and Song)是由加拿大瑞尔森大学的多伦多情感语音和歌曲数据库中心于2014年开发的一个综合情感表达数据集。该数据集旨在为情感识别研究提供一个标准化的资源,涵盖了24名专业演员(12名男性和12名女性)的语音和歌曲样本,每个样本表达了八种基本情感(中性、平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶)。RAVDESS的推出极大地推动了情感计算领域的发展,为研究人员提供了一个高质量、多样化的数据集,从而促进了情感识别算法的研究和应用。
当前挑战
尽管RAVDESS数据集在情感识别领域具有重要意义,但其构建过程中也面临了诸多挑战。首先,情感的定义和分类在不同文化和个体间存在差异,这使得情感标注的标准化成为一个难题。其次,录音环境和设备的不同可能导致音频质量的差异,影响情感识别的准确性。此外,数据集的多样性虽然丰富,但如何确保样本的代表性和平衡性也是一个需要解决的问题。最后,随着技术的进步,如何持续更新和扩展数据集以适应新的研究需求,也是RAVDESS未来需要面对的挑战。
发展历史
创建时间与更新
RAVDESS数据集由Livingstone和Bachorowski于2012年创建,旨在提供一个标准化的情感语音数据库。该数据集在创建后未有官方更新记录。
重要里程碑
RAVDESS数据集的发布标志着情感识别领域的一个重要里程碑。它包含了24名演员的语音样本,涵盖了8种基本情感(如愤怒、悲伤、喜悦等),每种情感有不同的强度和情境。这一多样性和标准化的特点使得RAVDESS成为情感计算和语音处理研究中的重要资源,极大地推动了相关算法的发展和评估。
当前发展情况
当前,RAVDESS数据集在情感识别和语音处理领域仍具有重要地位。它被广泛应用于机器学习和深度学习算法的训练与测试,特别是在情感分析和语音合成技术的研究中。尽管已有新的数据集出现,RAVDESS因其标准化和多样性,继续为研究人员提供宝贵的资源,推动了情感计算技术的不断进步和应用扩展。
发展历程
  • RAVDESS数据集首次发表,由加拿大情绪与情感表达研究实验室(CREA)发布,旨在提供一个标准化的音频和视频数据集,用于情感识别研究。
    2018年
  • RAVDESS数据集首次应用于多个情感识别算法的研究中,显著提升了情感识别的准确性和鲁棒性。
    2019年
  • RAVDESS数据集被广泛应用于跨模态情感识别研究,促进了音频和视频情感特征的联合分析。
    2020年
  • RAVDESS数据集成为情感计算领域的重要基准数据集之一,被多个国际会议和期刊引用,推动了情感识别技术的发展。
    2021年
常用场景
经典使用场景
在情感计算领域,RAVDESS数据集被广泛用于情感识别和语音情感分析的研究。该数据集包含了24名演员的语音和面部表情视频,涵盖了8种基本情感(如愤怒、悲伤、快乐等)。研究者常利用此数据集训练和验证情感识别模型,以探索语音特征与情感状态之间的关联。
解决学术问题
RAVDESS数据集解决了情感计算领域中情感识别模型的训练数据稀缺问题。通过提供标准化和多样化的情感表达样本,该数据集显著提升了情感识别算法的准确性和鲁棒性。此外,RAVDESS还促进了跨模态情感分析的研究,推动了语音与视觉信息融合技术的发展。
实际应用
RAVDESS数据集在实际应用中具有广泛潜力,如在人机交互、心理健康监测和情感机器人等领域。通过分析用户的语音情感,系统可以提供更智能和个性化的服务,如自动调节情绪支持或提供情感反馈。此外,该数据集还可用于开发情感识别工具,帮助心理健康专业人员进行早期干预和治疗。
数据集最近研究
最新研究方向
在情感计算领域,RAVDESS数据集因其丰富的情感表达样本而备受关注。最新研究方向主要集中在多模态情感识别上,通过整合语音、面部表情和肢体动作等多维度信息,提升情感识别的准确性和鲁棒性。相关研究还探讨了跨文化情感表达的差异,以及如何利用深度学习模型进行情感状态的实时分析和预测。这些研究不仅推动了人机交互技术的进步,也为心理健康监测和情感智能应用提供了新的可能性。
相关研究论文
  • 1
    The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)Ryerson University · 2018年
  • 2
    Emotion Recognition in Speech Using Deep Neural NetworksUniversity of Surrey · 2019年
  • 3
    A Comparative Study of Emotion Recognition Using RAVDESS DatasetUniversity of Malaya · 2020年
  • 4
    Exploring the Use of RAVDESS Dataset for Emotion Recognition in SpeechUniversity of Twente · 2021年
  • 5
    Multimodal Emotion Recognition Using RAVDESS DatasetUniversity of California, Irvine · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录