five

MultiPie Extended Ear Dataset|生物识别数据集|面部识别数据集

收藏
github2022-01-08 更新2024-05-31 收录
生物识别
面部识别
下载链接:
https://github.com/iremeyiokur/multipie_extended_ear_dataset
下载链接
链接失效反馈
资源简介:
该数据集是从Multi-PIE面部数据集中生成的扩展版本,主要发布自Multi-PIE面部数据集的图像名称和检测到的耳朵坐标。用户可以使用面部图像及其对应坐标来获取耳朵图像。此数据集在多模态年龄和性别分类研究中被使用,并已在相关论文中详细解释。

This dataset is an extended version generated from the Multi-PIE facial dataset, primarily releasing image names and detected ear coordinates from the Multi-PIE facial dataset. Users can utilize facial images along with their corresponding coordinates to obtain ear images. This dataset has been employed in multimodal age and gender classification research and has been thoroughly explained in related papers.
创建时间:
2020-04-02
原始信息汇总

MultiPie Extended Ear Dataset 概述

数据集定义

  • 来源:本数据集源自Multi-PIE面部数据集,仅发布图像名称和检测到的耳朵坐标。
  • 扩展版本:此数据集是Multi-PIE耳朵数据集的扩展版本。

数据集用途

  • 研究论文:该数据集已在我们的论文中被解释和使用,若对您有帮助,请引用。

数据集结构

  • CSV文件内容
    • Image Name:MultiPie面部数据集中的原始图像名称。
    • ID:MultiPie面部数据集中对应主题的原始ID。
    • Label:用于人物识别的主题标签。
    • Ear Side:指示对应的耳朵是左耳还是右耳。
    • x, y:边界框起始点的x和y坐标。
    • w, h:边界框的宽度和高度。

引用文献

  • Multi-PIE数据集
    • Gross, R., Matthews, I., Cohn, J.F., et al.: ‘Multi-PIE’. IEEE Int. Conf. on Automatic Face and Gesture Recognition (FG), 2008.
    • Gross, R., Matthews, I., Cohn, J.F., et al.: ‘Multi-PIE’. Image and Vision Computing, 2010, pp. 807–813.
  • 耳朵识别研究
    • Eyiokur, F.I., Yaman, D., and Ekenel, H.K.: "Domain adaptation for ear recognition using deep convolutional neural networks.", IET Biometrics 7.3 (2017): 199-206.
AI搜集汇总
数据集介绍
main_image_url
构建方式
MultiPie Extended Ear Dataset是基于Multi-PIE人脸数据集构建的扩展版本,专注于耳部图像的提取与分析。该数据集通过从Multi-PIE数据集中提取人脸图像,并结合检测到的耳部坐标信息,生成耳部图像。具体而言,数据集提供了每张原始图像的名称、对应的耳部边界框坐标(包括起始点x、y坐标以及宽度w和高度h),以及耳部所属的左右侧信息。这种构建方式使得研究者能够直接从人脸图像中提取耳部区域,为耳部识别及相关研究提供了便利。
特点
MultiPie Extended Ear Dataset的主要特点在于其专注于耳部图像的多样性与标注的精确性。数据集不仅包含了丰富的耳部图像样本,还提供了详细的耳部边界框坐标信息,便于研究者进行耳部区域的精确定位与分析。此外,数据集还标注了耳部的左右侧信息,为多模态年龄和性别分类等研究提供了重要支持。其扩展性使得该数据集能够与原始Multi-PIE数据集无缝结合,进一步拓展了应用场景。
使用方法
使用MultiPie Extended Ear Dataset时,研究者可通过CSV文件中的图像名称在Multi-PIE数据集中定位原始人脸图像,并结合提供的耳部坐标信息提取耳部区域。数据集的结构清晰,包含图像名称、ID、标签、耳部侧向信息以及边界框坐标,便于直接用于耳部识别、年龄和性别分类等任务。此外,数据集的使用需遵循相关论文的引用规范,以确保学术研究的透明性与可追溯性。
背景与挑战
背景概述
MultiPie Extended Ear Dataset是基于Multi-PIE人脸数据集扩展而来的耳部图像数据集,由Dogucan Yaman、Fevziye Irem Eyiokur和Hazim Kemal Ekenel等研究人员于2019年发布。该数据集主要用于多模态年龄和性别分类研究,特别是在耳部和侧面人脸图像的结合分析中展现了其独特价值。通过提供耳部图像的边界框坐标,该数据集为耳部识别和生物特征分析领域提供了重要的数据支持。其研究背景可追溯至2008年Multi-PIE数据集的发布,该数据集在面部表情和姿态识别领域具有广泛影响力。MultiPie Extended Ear Dataset的发布进一步推动了耳部识别技术的发展,并为相关领域的算法优化和模型训练提供了高质量的数据资源。
当前挑战
MultiPie Extended Ear Dataset在解决耳部识别和生物特征分类问题时面临多重挑战。首先,耳部图像的多样性和复杂性对模型的鲁棒性提出了较高要求,尤其是在不同光照、姿态和遮挡条件下,耳部特征的提取和匹配难度显著增加。其次,数据集构建过程中,从Multi-PIE人脸数据集中提取耳部图像并标注边界框坐标需要高精度的人工干预,这对数据标注的准确性和一致性提出了严峻挑战。此外,耳部识别作为生物特征识别的一个分支,其研究相对较少,缺乏成熟的基准模型和评估标准,这也为数据集的广泛应用带来了限制。如何在这些挑战中提升模型的泛化能力和识别精度,是该领域亟待解决的核心问题。
常用场景
经典使用场景
MultiPie Extended Ear Dataset 主要用于计算机视觉领域中的耳部识别研究。该数据集通过从Multi-PIE人脸数据集中提取耳部图像及其对应的坐标信息,为研究者提供了一个标准化的耳部图像数据集。经典的使用场景包括耳部检测、耳部特征提取以及耳部识别算法的开发与验证。通过该数据集,研究者能够在多角度、多光照条件下进行耳部识别实验,从而提升算法的鲁棒性和准确性。
衍生相关工作
基于MultiPie Extended Ear Dataset,研究者们开展了多项经典工作。例如,Yaman等人利用该数据集提出了多模态年龄和性别分类方法,结合耳部和侧面人脸图像进行综合分析,显著提升了分类精度。此外,该数据集还被用于深度学习模型的训练与验证,推动了耳部识别算法的技术进步。相关研究不仅扩展了耳部识别的应用场景,还为多模态生物特征识别提供了新的思路和方法。
数据集最近研究
最新研究方向
近年来,MultiPie Extended Ear Dataset在人耳识别领域的研究中展现出显著的前沿性。该数据集基于Multi-PIE人脸数据集扩展而来,专注于耳朵图像的提取与标注,为人耳识别提供了高质量的图像资源。随着深度学习技术的快速发展,该数据集被广泛应用于多模态年龄与性别分类的研究中,特别是在结合耳朵与侧面人脸图像的多模态特征提取方面取得了重要进展。相关研究不仅提升了人耳识别的准确率,还为跨域适应、深度学习模型优化等热点问题提供了新的实验平台。该数据集的发布与使用,推动了人耳识别技术在生物特征识别领域的应用,具有重要的学术价值与实践意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录

Global Religious Landscape

该数据集提供了全球宗教信仰的详细分析,包括不同国家和地区的宗教信仰分布、人口统计数据以及宗教信仰的变化趋势。数据涵盖了基督教、伊斯兰教、印度教、佛教等多种主要宗教。

www.pewforum.org 收录