five

DeepFashion2|时尚图像分析数据集|服装识别数据集

收藏
arXiv2019-01-24 更新2024-06-21 收录
时尚图像分析
服装识别
下载链接:
https://github.com/switchablenorms/DeepFashion2
下载链接
链接失效反馈
资源简介:
DeepFashion2是由香港中文大学创建的大型时尚图像数据集,包含491,000张图像和801,000个服装项目,每个项目都有丰富的标注,如风格、尺度、视角、遮挡、边界框、密集地标和掩码。数据集通过控制尺度、遮挡、缩放和视角的变量来收集,以创建一个具有挑战性的基准。DeepFashion2适用于多种时尚理解任务,包括服装检测、姿态估计、分割和检索,旨在解决时尚图像分析中的实际问题。
提供机构:
香港中文大学
创建时间:
2019-01-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
DeepFashion2数据集通过整合DeepFashion数据集和在线购物网站的图像,构建了一个大规模的时尚图像基准。该数据集包含491K张图像,涵盖43.8K种不同的服装身份,每种身份平均有12.7件不同风格的服装。数据集中的每件服装都标注了尺度、遮挡、视角、边界框、密集关键点(平均每件20个)和像素级掩码。此外,数据集还包含了873K对商业-消费者服装图像对,这些图像对来自同一服装身份,但分别由消费者和商业店铺拍摄。
特点
DeepFashion2数据集的主要特点在于其多样性和全面性。首先,每张图像中可以包含多个服装项目,这与DeepFashion每张图像仅标注一个服装项目的情况形成鲜明对比。其次,数据集提供了丰富的标注信息,包括密集的关键点、边界框和像素级掩码,这些标注信息支持服装检测、姿态估计、分割和检索等多项任务。此外,数据集通过控制图像的尺度、遮挡、缩放和视角等属性,增加了数据集的挑战性,使其更接近真实世界的应用场景。
使用方法
DeepFashion2数据集适用于多种时尚图像分析任务,包括服装检测、姿态估计、分割和检索。研究人员可以使用该数据集训练和评估模型,以解决这些任务中的挑战。例如,可以使用Mask R-CNN或Match R-CNN等框架进行服装检测和分割,使用关键点估计网络进行姿态估计,以及使用特征提取和相似度学习网络进行服装检索。数据集的丰富标注和多样性使其成为开发和测试时尚图像理解算法的理想平台。
背景与挑战
背景概述
近年来,时尚图像分析因其巨大的工业潜力而成为活跃的研究课题。随着时尚数据集的发展,如DeepFashion,该领域的研究取得了显著进展。然而,理解时尚图像在实际应用中仍然是一个挑战,主要由于服装的大变形、遮挡以及消费者和商业图像之间的领域差异。DeepFashion2数据集由香港中文大学和商汤科技的研究团队创建,旨在解决这些问题。该数据集包含491K张图像,涵盖13种流行服装类别,支持服装检测、姿态估计、分割和检索等多项任务。每个服装项目都标注有风格、尺度、视角、遮挡、边界框、密集地标和像素级掩码等丰富信息。DeepFashion2的发布为时尚图像分析提供了强大的基准,推动了相关领域的发展。
当前挑战
DeepFashion2数据集在构建过程中面临多项挑战。首先,解决的领域问题是时尚图像的多任务理解,包括服装检测、姿态估计、分割和检索,这些任务在实际应用中具有高度复杂性。其次,数据集的构建过程中,研究人员需要处理服装图像中的大变形、遮挡和视角变化等问题,确保标注的准确性和全面性。此外,数据集的多样性和大规模样本量也增加了标注和处理的难度。DeepFashion2的发布不仅填补了现有数据集的空白,还为未来的研究提供了丰富的资源和挑战,推动了时尚图像分析技术的发展。
常用场景
经典使用场景
DeepFashion2数据集在时尚图像分析领域具有广泛的应用,其经典使用场景包括服装检测、姿态估计、分割和重识别。这些任务通过数据集中丰富的标注,如实例级别的边界框、密集的关键点、像素级掩码以及消费者与商业图像对,得以高效实现。
解决学术问题
DeepFashion2数据集解决了现有时尚数据集在实际应用中的不足,如单件服装图像、稀疏关键点标注和缺乏像素级掩码等问题。通过提供大规模、多样化的标注,该数据集推动了服装检测、姿态估计、分割和重识别等任务的研究进展,为学术界提供了强有力的基准。
衍生相关工作
基于DeepFashion2数据集,研究者们开发了多种先进的算法和模型,如Match R-CNN,该模型结合了Mask R-CNN的架构,实现了端到端的服装检测、姿态估计、分割和重识别。此外,数据集还激发了关于多域学习、生成对抗网络(GANs)在时尚图像合成等方向的研究。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

IMDb Datasets

IMDb Datasets包含电影和电视节目的详细信息,包括电影名称、演员、导演、评分、评论等。数据集分为多个文件,如title.basics.tsv.gz、title.ratings.tsv.gz等,每个文件包含不同类型的信息。

www.imdb.com 收录

TT100K - Tsinghua-Tencent 100K

TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。

cg.cs.tsinghua.edu.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录