CASME II and SAMM

Name: CASME II and SAMM
Creator: 奥卢大学机器视觉与信号分析中心, 东南大学生物科学与医学工程学院
Published: 2025-07-14 20:27:09
License: 暂无描述

arXiv2025-07-14 更新2025-07-16 收录

下载链接：

https://github.com/IcedDoggie/ICMEW2025

下载链接

链接失效反馈

官方服务：

资源简介：

本文研究探讨了民族背景在表情分析中的作用，并构建了一个跨文化微表情数据库。该数据集结合了CASME II和SAMM数据集，并经过半自动标注，用于研究民族身份与微表情情感分析之间的关系。数据集包括54个独特主体的微表情样本，经过民族标注后，数据集被分为亚洲和非亚洲两大组。研究旨在探索民族因素对微表情识别的影响，并通过实验验证了民族偏见的存在。

This study examines the role of ethnic background in facial expression analysis and develops a cross-cultural micro-expression database. This dataset combines the CASME II and SAMM datasets, undergoes semi-automatic annotation, and is utilized to explore the relationship between ethnic identity and micro-expression emotion analysis. The dataset includes micro-expression samples from 54 unique subjects, and is divided into two major groups: Asian and non-Asian after ethnic annotation. The research aims to investigate the impact of ethnic factors on micro-expression recognition, and experimentally validates the existence of ethnic bias.

提供机构：

奥卢大学机器视觉与信号分析中心, 东南大学生物科学与医学工程学院

创建时间：

2025-07-14

搜集汇总

数据集介绍

构建方式

CASME II和SAMM数据集的构建采用了跨文化微表情数据库的整合方法，通过FaceXFormer算法对样本进行半自动化的民族标签标注。首先，利用FaceXFormer提取包括性别、年龄和民族在内的属性信息，随后通过启发式筛选对标注结果进行校正，以确保标签的准确性。最终，将原始民族标签映射为亚洲和非亚洲两大类别，以平衡数据分布并简化后续分析。这一构建过程不仅优化了数据的可用性，还为跨文化微表情研究提供了坚实的基础。

使用方法

该数据集的使用方法主要包括民族驱动的特征学习和跨文化微表情分析。研究人员可以通过光学流图像提取运动特征，并结合RGB纹理特征进行民族上下文建模。数据集支持留一受试者交叉验证（LOSO）和复合数据库评估（CDE）协议，适用于各类深度学习模型的训练与测试。此外，数据集还可用于验证民族偏见在微表情识别中的存在及其影响，为情感计算领域的跨文化研究提供了重要工具。

背景与挑战

背景概述

CASME II and SAMM数据集是由芬兰奥卢大学机器视觉与信号分析中心的研究团队创建的，旨在探究微表情识别中的跨文化因素。该数据集结合了CASME II和SAMM两个现有的微表情数据集，并通过半自动化的方式添加了种族标签，以便系统性地研究种族背景与微表情特征之间的关系。微表情作为短暂且自发的面部动作，能够揭示真实的隐藏情绪，在心理学诊断、面试和审讯等高风险环境中具有重要应用价值。然而，传统研究基于Ekman的情绪普遍性假设，忽视了种族和文化对微表情表达的潜在影响。CASME II and SAMM数据集的建立填补了这一研究空白，为跨文化微表情分析提供了重要工具。

当前挑战

CASME II and SAMM数据集面临的主要挑战包括：1) 领域问题的挑战：微表情识别本身具有极高的技术难度，因其短暂且微妙的特性，传统算法难以准确捕捉和分类。此外，跨文化因素进一步增加了识别的复杂性，不同种族和文化背景下的微表情表达可能存在显著差异，这对算法的泛化能力提出了更高要求。2) 构建过程的挑战：数据集的构建涉及多个步骤的复杂处理，包括种族标签的半自动化标注、数据分布的平衡以及情感类别的重新映射。其中，种族标签的准确性尤为关键，但自动化标注工具可能产生误差，需要通过启发式方法进行人工校正。此外，数据样本的不平衡问题（如非亚洲样本数量较少）也给模型的训练和评估带来了挑战。

常用场景

经典使用场景

CASME II和SAMM数据集在微表情识别领域具有广泛的应用，尤其在跨文化情感计算研究中扮演了重要角色。该数据集通过结合CASME II（主要包含亚洲受试者）和SAMM（多文化受试者）的数据，构建了一个跨文化微表情数据库，为研究不同文化背景下的微表情差异提供了基础。数据集常用于训练和验证微表情识别算法，特别是在探索文化因素对情感表达影响的研究中。

解决学术问题

该数据集解决了微表情识别中文化差异对情感表达影响的学术问题。传统研究基于Ekman的情感普遍性假设，认为情感表达在不同文化中是相同的。然而，CASME II和SAMM数据集通过跨文化数据对比，揭示了文化背景对微表情表达的显著影响，挑战了这一假设。数据集还为研究文化偏差在情感计算中的作用提供了实证基础，推动了跨文化微表情识别领域的发展。

实际应用

在实际应用中，CASME II和SAMM数据集被广泛用于心理学诊断、安全审讯和情感计算等领域。例如，在心理学诊断中，通过分析不同文化背景下的微表情，可以更准确地识别患者的真实情感状态。此外，数据集还被用于开发跨文化情感识别系统，提升人工智能在全球化环境中的适用性。

数据集最近研究