five

FER2013, JAFFE, CK+, FERG|面部表情识别数据集|深度学习数据集

收藏
github2023-12-06 更新2024-05-31 收录
面部表情识别
深度学习
下载链接:
https://github.com/Mubashir42884/DeepFER-Facial-Expression-Recognition-with-Deep-Neural-Network-and-Attentional-Convolutional-Network
下载链接
链接失效反馈
资源简介:
这是一个计算机视觉项目和论文,基于深度神经网络和注意力卷积网络来识别各种人类面部表情。该项目包括FER2013、JAFFE、CK+和FERG数据集。项目使用Python及其流行的深度学习模块如TensorFlow、Keras和PyTorch制作。

This is a computer vision project and paper that utilizes deep neural networks and attention convolutional networks to recognize various human facial expressions. The project incorporates datasets such as FER2013, JAFFE, CK+, and FERG. It is developed using Python along with popular deep learning modules like TensorFlow, Keras, and PyTorch.
创建时间:
2023-11-26
原始信息汇总

数据集概述

数据集名称

DeepFER: Facial Expression Recognition with Deep Neural Network and Attentional Convolutional Network

作者

  • Mubashir Mohsin
  • Shahriar Hossain Rafi
  • Jishan Ferdows Navil

监督者

Dr. Debajyoti Karmaker, Associate Professor, Department of Computer Science, AIUB

数据集内容

  • FER2013
  • JAFFE
  • CK+
  • FERG

技术与工具

  • Python
  • TensorFlow
  • Keras
  • PyTorch

研究内容

  • 深度学习框架,基于注意力卷积网络
  • 可视化技术,用于识别关键面部区域

关键词

  • 深度学习
  • 计算机视觉
  • 面部表情识别
  • 空间变换
  • 注意力机制
  • 神经网络
  • CNN
AI搜集汇总
数据集介绍
main_image_url
构建方式
FER2013、JAFFE、CK+和FERG数据集的构建过程基于深度神经网络和注意力卷积网络,旨在识别人类面部表情。这些数据集通过Python及其深度学习模块如TensorFlow、Keras和PyTorch进行处理和训练。FER2013数据集包含超过35,000张面部表情图像,涵盖了七种基本情绪;JAFFE数据集由213张日本女性面部表情图像组成;CK+数据集则包含了593个视频序列,捕捉了从初始到峰值表情的变化;FERG数据集则是一个3D面部表情生成数据集,包含多种表情的合成图像。
特点
FER2013、JAFFE、CK+和FERG数据集的特点在于其多样性和复杂性。FER2013数据集规模庞大,涵盖了广泛的表情变化;JAFFE数据集则专注于特定文化背景下的表情表达;CK+数据集通过视频序列捕捉表情的动态变化;FERG数据集则提供了高质量的3D合成表情图像。这些数据集共同为面部表情识别研究提供了丰富的实验材料,能够支持从静态图像到动态视频的多维度分析。
使用方法
使用FER2013、JAFFE、CK+和FERG数据集时,研究人员可以通过深度学习框架如TensorFlow、Keras和PyTorch进行模型训练和测试。首先,数据集需要经过预处理,包括图像归一化、数据增强等步骤。随后,利用卷积神经网络(CNN)和注意力机制进行特征提取和分类。通过可视化技术,研究人员可以分析模型在识别不同表情时的关键面部区域,从而优化模型性能。这些数据集的使用不仅限于学术研究,还可应用于人机交互、情感计算等领域。
背景与挑战
背景概述
FER2013、JAFFE、CK+和FERG数据集是面部表情识别领域的重要资源,广泛应用于计算机视觉和情感计算研究。这些数据集由多个研究机构和学者共同创建,旨在解决面部表情识别中的复杂问题。FER2013数据集由Pierre-Luc Carrier和Aaron Courville于2013年发布,包含了超过35,000张标记的面部表情图像。JAFFE数据集由日本学者于1998年发布,包含了213张女性面部表情图像,是早期面部表情识别研究的重要基础。CK+数据集则是由Jeffrey Cohn等人于2010年发布,扩展了Cohn-Kanade数据集,包含了593个视频序列,涵盖了多种表情变化。FERG数据集则专注于动画角色的面部表情,由Aubrey Edwards等人于2016年发布。这些数据集共同推动了深度学习模型在面部表情识别中的应用,尤其是在卷积神经网络(CNN)和注意力机制的结合上取得了显著进展。
当前挑战
面部表情识别领域面临的主要挑战包括表情的多样性和复杂性。首先,面部表情具有高度的类内差异,例如同一种表情在不同个体或文化背景下可能表现出不同的特征。其次,数据集中存在光照、姿态、遮挡等干扰因素,这些因素显著增加了识别的难度。在构建数据集的过程中,研究人员需要克服数据标注的主观性和不一致性,尤其是在跨文化背景下,表情的标注可能因文化差异而产生偏差。此外,深度学习模型在处理小样本数据时容易过拟合,而JAFFE等数据集的样本量相对较小,限制了模型的泛化能力。尽管注意力机制和空间变换技术的引入提升了模型的性能,但如何进一步提高模型的鲁棒性和可解释性仍然是当前研究的核心挑战。
常用场景
经典使用场景
FER2013、JAFFE、CK+和FERG数据集在面部表情识别领域具有广泛的应用。这些数据集通常用于训练和验证深度学习模型,特别是卷积神经网络(CNN)和注意力机制模型。通过这些数据集,研究人员能够开发出能够准确识别人类面部表情的算法,从而在情感计算、人机交互和心理研究等领域发挥重要作用。
解决学术问题
这些数据集解决了面部表情识别中的关键学术问题,如面部表情的多样性和复杂性。传统的特征提取方法在处理这些复杂数据时表现不佳,而深度学习模型通过端到端的学习方式,能够更好地捕捉面部表情的细微变化。特别是注意力机制的引入,使得模型能够聚焦于面部关键区域,显著提高了识别精度。
衍生相关工作
基于这些数据集,许多经典的研究工作得以展开。例如,注意力卷积网络(ACN)的提出,显著提升了面部表情识别的性能。此外,这些数据集还催生了多种可视化技术,帮助研究人员理解模型在识别过程中的决策依据。这些工作不仅推动了面部表情识别技术的发展,也为相关领域的研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录