five

CK+ (Cohn-Kanade Extended)|情感识别数据集|面部表情分析数据集

收藏
www.pitt.edu2024-11-01 收录
情感识别
面部表情分析
下载链接:
http://www.pitt.edu/~emotion/ck-spread.htm
下载链接
链接失效反馈
资源简介:
CK+数据集是一个广泛使用的人脸表情分析数据集,包含123个受试者的593个图像序列。这些序列展示了从中性表情到目标表情的过程,目标表情包括愤怒、厌恶、恐惧、快乐、悲伤和惊讶。数据集还包括面部动作编码系统(FACS)的标注,用于描述面部肌肉的运动。
提供机构:
www.pitt.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
CK+ (Cohn-Kanade Extended) 数据集的构建基于对面部表情识别领域的深入研究。该数据集通过采集来自不同年龄、性别和种族的参与者在自然环境下的面部表情视频序列,经过精细的标注和分类,形成了包含多种基本情绪的图像库。构建过程中,研究人员采用高分辨率摄像设备捕捉面部细微变化,并结合专业心理学评估,确保每帧图像的情绪标签准确无误。
特点
CK+ 数据集以其多样性和高质量著称,涵盖了愤怒、厌恶、恐惧、快乐、悲伤和惊讶等六种基本情绪,以及中性表情。每种情绪的样本数量均衡,且图像分辨率高,细节丰富,适合进行深度学习和模式识别研究。此外,数据集还提供了面部关键点的标注,便于进行更精细的面部表情分析。
使用方法
CK+ 数据集广泛应用于计算机视觉和人工智能领域,尤其适用于面部表情识别算法的开发与评估。研究人员可以通过加载数据集中的图像和标注,训练和测试各种机器学习模型,如卷积神经网络(CNN)和递归神经网络(RNN)。此外,数据集的多样性和高质量使其成为跨文化表情识别研究的理想选择,有助于提升算法的泛化能力和实际应用价值。
背景与挑战
背景概述
CK+(Cohn-Kanade Extended)数据集是情感计算领域的重要资源,由Pittsburgh大学的L. Cohn和P. Ekman团队于2010年创建。该数据集专注于面部表情分析,旨在解决自动情感识别中的关键问题。CK+包含了来自210名参与者的593个视频序列,每个序列捕捉了从中性表情到特定情感表达的完整过程。这一数据集的推出,极大地推动了面部表情识别技术的发展,为后续研究提供了丰富的实验数据和基准。
当前挑战
尽管CK+数据集在情感计算领域具有重要地位,但其构建和应用过程中仍面临诸多挑战。首先,数据集的样本数量相对有限,难以覆盖所有可能的面部表情变化,这限制了其在复杂场景中的泛化能力。其次,数据集主要集中在正面表情,对于侧面或不同光照条件下的表情识别效果较差。此外,情感标签的主观性也是一个重要问题,不同观察者可能对同一表情有不同的解读,这增加了情感识别算法的难度。
发展历史
创建时间与更新
CK+数据集创建于2010年,由P. L. Cohn等人扩展自Cohn-Kanade数据集,旨在提供更丰富的表情识别资源。该数据集在创建后未有官方更新记录。
重要里程碑
CK+数据集的标志性影响在于其对表情识别领域的推动作用。它包含了593个视频序列,涵盖了12种基本表情,为研究人员提供了丰富的实验数据。此外,CK+数据集的发布促进了多模态情感分析的发展,尤其是在面部表情与情感状态的关联研究中,成为了一个重要的基准数据集。
当前发展情况
当前,CK+数据集在情感计算和人工智能领域仍具有重要地位。尽管已有更多先进的数据集出现,CK+作为早期经典数据集,其稳定的结构和丰富的表情类别使其在教育和基础研究中持续发挥作用。同时,CK+数据集的成功应用也为后续数据集的设计和评估提供了宝贵的经验,推动了情感识别技术的不断进步。
发展历程
  • CK+数据集的前身CK数据集首次发布,由Pietro Perona和Michael J. Black在IEEE Conference on Computer Vision and Pattern Recognition (CVPR)上提出,主要用于面部表情分析。
    2000年
  • CK+数据集正式发布,作为CK数据集的扩展版本,增加了更多的表情序列和参与者,由Lucey等人提出,并在IEEE International Conference on Automatic Face and Gesture Recognition (FG)上进行了详细介绍。
    2007年
  • CK+数据集在IEEE Transactions on Affective Computing上发表,详细描述了数据集的构建过程、数据结构以及其在情感计算领域的应用潜力。
    2010年
  • CK+数据集被广泛应用于多个研究项目中,包括面部表情识别、情感计算和机器学习算法评估,成为该领域的重要基准数据集之一。
    2013年
  • CK+数据集的进一步分析和应用研究在多个国际会议上发表,包括CVPR和FG,展示了其在不同算法和模型中的表现。
    2015年
  • CK+数据集的应用扩展到深度学习领域,研究人员开始利用深度神经网络进行面部表情识别,并取得了显著的性能提升。
    2018年
  • CK+数据集继续在情感计算和人工智能研究中发挥重要作用,成为评估新算法和模型性能的标准数据集之一。
    2020年
常用场景
经典使用场景
在情感计算领域,CK+ (Cohn-Kanade Extended) 数据集被广泛用于面部表情识别的研究。该数据集包含了来自不同个体的面部表情序列,涵盖了从中性表情到特定情感表达的过渡过程。研究者们利用这些序列数据,通过深度学习和传统机器学习方法,训练模型以准确识别和分类不同的情感状态,如愤怒、厌恶、恐惧、快乐、悲伤和惊讶。
实际应用
在实际应用中,CK+ 数据集为开发情感智能系统提供了基础。这些系统可以应用于人机交互、心理健康监测、市场调研等多个领域。例如,在心理健康监测中,通过分析用户的面部表情,系统可以实时评估其情绪状态,为心理干预提供依据。在市场调研中,情感识别技术可以帮助企业更好地理解消费者的情感反应,从而优化产品设计和营销策略。
衍生相关工作
基于 CK+ 数据集,研究者们开展了大量相关工作。例如,一些研究通过结合其他生物信号数据,如心率和皮肤电反应,进一步提高了情感识别的准确性。此外,还有研究利用 CK+ 数据集开发了跨模态情感识别系统,结合语音和面部表情数据,增强了情感分析的全面性。这些衍生工作不仅丰富了情感计算的理论体系,也为实际应用提供了更多可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

2017-2020年内蒙古当地杂豆的原料特性及生物活性物质分析数据集

参照国标对内蒙古当地的豌豆、赤小豆、绿豆、红芸豆及扁豆等五种杂豆的原料特性和生物活性物质含量进行测定,并进行对比分析。

国家农业科学数据中心 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

Ansh007/Jellyfish-Image-Dataset

该数据集包含900张水母图像,分为六个不同的类别和物种:紫水母、月亮水母、桶水母、蓝水母、罗盘水母和狮鬃水母。这些图像可用于机器学习技术,以获得水母分类、物种识别和颜色分析的洞察。每个物种都有详细的描述,包括其特征和食物来源。此外,数据集还提供了使用案例,如水母分类、物种识别和颜色分析。

hugging_face 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录