five

Aff-Wild2|情感识别数据集|面部表情分析数据集

收藏
github2023-12-08 更新2024-05-31 收录
情感识别
面部表情分析
下载链接:
https://github.com/coder-xinxiaohai/Aff-Wild2_Processing
下载链接
链接失效反馈
资源简介:
本项目完成了对Aff-Wild2数据集中,表情被标记为中性、生气、厌恶、恐惧、高兴、悲伤和惊讶,7种表情之一,且效价和唤醒值均在[0,1]范围内的图像筛选任务,并生成相关文件用于存放筛选出的图像路径及对应的标签信息。数据集包括了对图像进行面部对齐、裁剪,并缩放至112*112的处理。

This project has accomplished the task of filtering images from the Aff-Wild2 dataset, where expressions are labeled as one of the seven categories: neutral, angry, disgusted, fearful, happy, sad, and surprised, with both valence and arousal values within the [0,1] range. Relevant files have been generated to store the paths of the filtered images along with their corresponding label information. The dataset includes processing steps such as facial alignment, cropping, and resizing the images to 112*112 pixels.
创建时间:
2023-12-06
原始信息汇总

Aff-Wild2_Processing 数据集概述

数据集内容

  • 表情分类:数据集包含7种表情,分别是中性、生气、厌恶、恐惧、高兴、悲伤和惊讶。
  • 效价和唤醒值:所有图像的效价和唤醒值均在[0,1]范围内。

数据集规模

  • 训练图像:共筛选出329789张图像,具体分布如下:
    • 中性:132756张
    • 生气:13834张
    • 厌恶:5470张
    • 恐惧:8080张
    • 高兴:75328张
    • 悲伤:68256张
    • 惊讶:26065张
  • 验证图像:共筛选出135468张图像,具体分布如下:
    • 中性:69498张
    • 生气:5874张
    • 厌恶:625张
    • 恐惧:7787张
    • 高兴:24417张
    • 悲伤:20070张
    • 惊讶:7197张

数据处理

  • 图像处理:数据集中的图像已经过面部对齐、裁剪,并缩放至112*112大小。
  • 数据准备
    • 图像文件需解压并存放于Image文件夹。
    • 标签信息需解压并存放于Label文件夹。
  • 数据处理流程
    • 运行pickle_annotations_affwild2.py生成data_affwild2.pkl文件。
    • 运行save_annotatons_affwild2.py生成train_label.txt和val_label.txt文件。
    • 可选运行dataloading.py和cal_each_category_img_nums.py文件进行数据加载和类别统计。

标签加噪

  • 加噪操作:通过运行generate_noise_label.py文件,可对训练标签进行10%、20%、30%的加噪处理,结果文件存于result文件夹。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Aff-Wild2数据集的构建过程涉及对大量面部图像进行筛选和标注,确保每张图像的表情被准确分类为中性、生气、厌恶、恐惧、高兴、悲伤或惊讶七种基本情绪之一。数据集中的图像经过面部对齐、裁剪,并统一缩放至112*112像素,以保证数据的一致性和处理效率。此外,每张图像的效价和唤醒值均被标准化至[0,1]范围内,为情感分析提供了精确的量化基础。
使用方法
使用Aff-Wild2数据集时,首先需要从官方网站申请并下载数据集,包括面部图像和标签信息。下载后,将图像和标签分别解压至指定的Image和Label文件夹中。接着,通过运行提供的Python脚本,如pickle_annotations_affwild2.py和save_annotatons_affwild2.py,生成用于模型训练的数据文件。此外,研究者还可以利用generate_noise_label.py脚本对训练标签进行加噪处理,以模拟现实世界中的标签不确定性,增强模型的鲁棒性。整个数据处理流程旨在简化数据准备步骤,使研究者能够快速投入到情感识别模型的开发与实验中。
背景与挑战
背景概述
Aff-Wild2数据集是一个专注于面部表情识别的研究数据集,由伦敦帝国理工学院的研究团队于2019年发布。该数据集旨在解决面部表情分析中的效价和唤醒值预测问题,涵盖了中性、生气、厌恶、恐惧、高兴、悲伤和惊讶等七种基本表情。Aff-Wild2数据集通过提供大量经过面部对齐和裁剪的图像,显著推动了情感计算领域的发展,尤其是在自然场景下的情感识别任务中,具有重要的研究价值和应用前景。
当前挑战
Aff-Wild2数据集在应用过程中面临多重挑战。首先,数据集中的表情分布不均衡,例如中性表情样本远多于其他表情类别,这可能导致模型在训练过程中偏向于多数类,影响分类性能。其次,尽管数据集已经进行了面部对齐和裁剪处理,但在自然场景下,光照、姿态和遮挡等因素仍然对表情识别的准确性构成挑战。此外,数据集的获取需要通过申请流程,且未完全开源,这在一定程度上限制了研究者的广泛使用。最后,标签加噪处理虽然增加了数据集的鲁棒性,但也可能引入额外的噪声,影响模型的泛化能力。
常用场景
经典使用场景
Aff-Wild2数据集在情感计算领域具有广泛的应用,尤其是在面部表情识别和情感分析的研究中。该数据集包含了大量标记为七种基本表情的图像,且每张图像都标注了效价和唤醒值,为研究者提供了一个丰富的实验平台。通过该数据集,研究者可以训练和验证情感识别模型,探索不同表情之间的细微差异,进而提升模型的准确性和鲁棒性。
解决学术问题
Aff-Wild2数据集有效解决了情感计算领域中的多个关键问题。首先,它提供了大规模且多样化的面部表情数据,解决了以往数据集样本量不足的问题。其次,数据集中的效价和唤醒值标注为情感强度的量化研究提供了基础。此外,数据集经过面部对齐和裁剪处理,减少了数据预处理的工作量,使研究者能够更专注于模型的设计与优化。
实际应用
在实际应用中,Aff-Wild2数据集为情感识别技术的落地提供了重要支持。例如,在智能人机交互系统中,基于该数据集训练的模型可以实时分析用户的面部表情,从而调整系统的反馈策略,提升用户体验。此外,该数据集还可用于心理健康监测,通过分析患者的面部表情变化,辅助医生进行情绪障碍的诊断和治疗。
数据集最近研究
最新研究方向
在情感计算领域,Aff-Wild2数据集因其丰富的面部表情标注和效价唤醒值的连续标注而备受关注。近年来,研究者们利用该数据集在面部表情识别、情感状态预测以及情感计算模型的鲁棒性提升等方面取得了显著进展。特别是在深度学习模型的训练中,Aff-Wild2数据集被广泛应用于多任务学习框架,以同时优化表情分类和效价唤醒值的回归任务。此外,随着对抗性训练和数据增强技术的发展,研究者们开始探索如何在Aff-Wild2数据集上引入噪声标签,以增强模型在真实场景中的泛化能力。这些研究不仅推动了情感计算技术的进步,也为心理健康监测和人机交互系统的开发提供了有力支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

Agricultural Pests Dataset

Agricultural Pests Classification

kaggle 收录

人民日报语料库 (1998.1)

本库主要提供用于NER任务的处理好的语料,包括基于词级和字级任务的NER数据。数据集包含19484个以行为粒度切分的句子,句子长度最大为659,平均长度为57.55666187641141。实体标注采用BIO格式,区分人名、地名和机构团体。

github 收录