Celeb-FBI
收藏arXiv2024-07-04 更新2024-07-23 收录
下载链接:
pronaydebnath99@gmail.com
下载链接
链接失效反馈官方服务:
资源简介:
Celeb-FBI数据集由阿赫桑尼大学科学技术学院的计算机科学与工程系创建,包含7,211张来自不同地区的名人全身图像及其详细属性。数据集大小经过精心筛选,确保图像质量和属性准确性。创建过程中采用了图像清洗、缩放和SMOTE技术以优化数据。该数据集主要应用于时尚分析、人体工程学设计、虚拟现实和体育表现分析等领域,旨在通过深度学习方法提高人体属性估计的准确性。
The Celeb-FBI dataset was created by the Department of Computer Science and Engineering, School of Science and Technology, Ahsani University. It comprises 7,211 full-body images of celebrities from various regions, alongside detailed attribute annotations. The dataset underwent rigorous screening to ensure both high image quality and accurate attribute labeling. During its development, image cleaning, resizing, and SMOTE techniques were employed to optimize the dataset. This dataset is primarily utilized in domains such as fashion analysis, ergonomic design, virtual reality, and sports performance analysis, aiming to improve the accuracy of human attribute estimation via deep learning methods.
提供机构:
计算机科学与工程系,阿赫桑尼大学科学技术学院,达卡,孟加拉国
创建时间:
2024-07-04
搜集汇总
数据集介绍
构建方式
本研究团队构建了‘Celeb-FBI’数据集,包含7,211张流行名人的全身图像,每张图像均附带详细的个人属性信息,如身高、体重、年龄和性别。图像采集自www.google.com和www.bing.com,确保不侵犯版权。数据集通过严格的清洗、缩放和SMOTE技术处理,以平衡类别的分布,并用于训练三种深度学习模型:CNN、50层ResNet和16层VGG,以估计图像中人物的年龄、性别、身高和体重。
特点
‘Celeb-FBI’数据集的特点在于其包含了全身图像以及与之对应的精确个人属性信息,为多标签分类问题提供了一个基准。数据集覆盖了不同地区和背景的名人,具有广泛的代表性。此外,数据集通过应用SMOTE技术处理了类别的失衡问题,提高了分类性能。
使用方法
使用‘Celeb-FBI’数据集时,研究者可以将其分为训练集和测试集,采用深度学习模型进行特征提取和分类。数据集的图像经过预处理,包括清洗、缩放和平衡类别分布。训练过程中,研究者可以使用CNN、ResNet-50或VGG-16模型,并根据准确度、精确度、召回率和F1分数等指标评估模型的性能。
背景与挑战
背景概述
‘Celeb-FBI’数据集是由孟加拉国达卡阿赫桑拉大学计算机科学与工程系的Pronay Debnath等研究人员于近期创建的。该数据集包含7,211张名人全身图像,每张图像都附带详细的信息,如身高、年龄、体重和性别。这一数据集的创建旨在解决监控、图像检索系统、医疗保健等领域对全面身图像数据集的迫切需求。该数据集不仅为时尚产业分析、人机交互设计评估、虚拟现实角色创建、运动性能分析等领域提供了宝贵的资源,也为相关领域的研究人员提供了新的研究方向和工具。
当前挑战
在构建‘Celeb-FBI’数据集的过程中,研究人员面临着多个挑战。首先,由于缺乏公开可用的包含详细属性信息的全身图像数据集,研究人员不得不自行收集和标注数据,这增加了数据收集的难度。其次,数据集中存在的类间差异,如年龄超过80岁、体重超过60公斤、身高异常等情况,导致数据分布不均,这对模型的训练和预测能力提出了更高的要求。此外,为了提高数据集的质量和模型的性能,研究人员采用了合成少数类过采样技术(SMOTE)来平衡数据集,并使用三种深度学习模型进行属性预测,这也在技术和计算资源上提出了挑战。
常用场景
经典使用场景
Celeb-FBI数据集被广泛应用于估计人的年龄、性别、身高和体重,其经典使用场景在于提供了一种基于深度学习的方法,可以从人的全身图像中准确预测这些生物特征。这种技术在安全认证、内容-based图像检索、监视系统、生物识别等领域具有广泛的应用。
实际应用
在实用场景中,Celeb-FBI数据集可以被用于开发健康评估工具,例如预测身体质量指数(BMI)和基础代谢率(BMR),这对于医疗健康决策支持系统具有重要意义。此外,它还可以用于时尚产业分析、人体工程学评估、虚拟现实角色创建和运动性能分析等领域。
衍生相关工作
基于Celeb-FBI数据集,衍生出了一系列相关的研究工作,包括但不限于使用该数据集进行的不同类型的图像分类和回归任务,如基于深度学习的身高、体重估计,以及面部图像与身体特征之间的关系研究等。这些工作进一步扩展了数据集的应用范围,并推动了计算机视觉和模式识别领域的发展。
以上内容由遇见数据集搜集并总结生成



