CFPD | Colorful Fashion Parsing Data
收藏github2024-04-01 更新2024-05-31 收录
下载链接:
https://github.com/minar09/dataset-CFPD-windows
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2,682张图像,每张图像大小为600x400像素,具有像素级别的标注,包括23个类别和13种颜色。数据集用于时尚解析,特别是在处理弱颜色类别标签的场景中。
This dataset comprises 2,682 images, each with a resolution of 600x400 pixels, featuring pixel-level annotations that include 23 categories and 13 colors. It is specifically designed for fashion parsing, particularly in scenarios dealing with weakly labeled color categories.
创建时间:
2018-12-31
原始信息汇总
数据集概述
基本信息
- 名称: CFPD | Colorful Fashion Parsing Data
- 图像数量: 2,682张
- 图像尺寸: 600 x 400像素
- 标注类型: 像素级标注(分割图)
标注细节
- 类别数量: 23个
- 颜色数量: 13种
- 细分标注:
- 类别标签: 映射超级像素ID(1~425)到精细类别ID(1~117)
- 颜色标签: 映射超级像素ID(1~425)到精细颜色ID(1~60)
数据集结构
- 主要文件:
fashon_parsing_data.mat: 包含图像信息和标注数据label/bbox.json: 边界框标注(用于对象检测)label/categories.tsv: 包含类别ID和类别名称label/main_categories.tsv: 用于对象检测的类别选择
数据集处理
- 数据准备:
- 安装依赖:
pip install -r requirements.txt - 下载数据: 从作者的GoogleDrive下载zip文件
- 解压数据: 手动或使用命令行工具
- 生成标注文件:
python make_label.py - 转换数据格式: 从.mat到.hdf5,再到图像和标注列表
- 安装依赖:
数据集问题
- 数据集的问题在相关论文的Figure 7中有所提及。
搜集汇总
数据集介绍

构建方式
CFPD(Colorful Fashion Parsing Data)数据集的构建基于时尚图像解析的研究需求,旨在提供丰富的像素级标注信息。该数据集包含2,682张分辨率为600x400的时尚图像,每张图像均经过精细的像素级标注,涵盖23个类别和13种颜色。数据集的原始数据以MATLAB的.mat文件形式存储,通过`make_label.py`脚本生成边界框标注文件和类别信息文件。此外,数据集还通过MATLAB脚本将.mat文件转换为HDF5格式,并进一步导出为带有注释的图像和列表文件。
特点
CFPD数据集的特点在于其丰富的标注信息和多样化的时尚图像内容。每张图像不仅包含像素级的语义分割标注,还提供了详细的颜色类别信息,使得该数据集在时尚解析和颜色识别任务中具有重要价值。数据集中的23个类别和13种颜色标签为研究者提供了广泛的分析维度,能够支持复杂的时尚图像解析任务。此外,数据集的图像分辨率较高,确保了标注信息的精确性和细节的丰富性。
使用方法
使用CFPD数据集时,首先需要安装所需的依赖库,并通过`download.sh`脚本从作者的Google Drive下载数据文件。下载完成后,需将数据文件重命名为`data.zip`并解压。随后,通过`make_label.py`脚本从`fashon_parsing_data.mat`文件中生成类别和边界框标注文件。接着,使用MATLAB脚本将.mat文件转换为HDF5格式,并通过`export.py`脚本将HDF5文件导出为带有注释的图像和列表文件。这一系列步骤确保了数据集的完整性和可用性,为后续的时尚图像解析研究提供了坚实的基础。
背景与挑战
背景概述
CFPD(Colorful Fashion Parsing Data)数据集由S. Liu等人于2014年提出,旨在解决时尚图像解析中的颜色与类别标注问题。该数据集包含2,682张像素级标注的图像,每张图像的分辨率为600x400,涵盖了23个类别和13种颜色。CFPD的创建为时尚图像解析领域提供了重要的数据支持,尤其是在弱监督学习环境下,通过颜色类别标签进行图像分割的研究。该数据集在时尚解析、图像分割及计算机视觉领域具有广泛的应用价值,推动了相关算法的研究与优化。
当前挑战
CFPD数据集在解决时尚图像解析问题时面临多重挑战。首先,由于时尚图像的多样性和复杂性,精确的像素级标注需要大量的人工成本,且标注过程中易引入误差。其次,颜色与类别标签的弱监督学习增加了模型训练的难度,如何在有限标注信息下实现高精度的图像分割成为核心问题。此外,数据集的构建过程中,从原始MATLAB文件到最终图像与标注的转换涉及复杂的预处理步骤,包括文件格式转换、数据清洗与标注生成,这些步骤对数据集的可用性与完整性提出了更高的技术要求。
常用场景
经典使用场景
在时尚图像解析领域,CFPD数据集被广泛应用于像素级语义分割任务。该数据集包含2,682张时尚图像,每张图像均标注了23个类别和13种颜色的像素级分割信息。研究人员利用这些精细的标注数据,训练深度学习模型以识别图像中的不同服装部件及其颜色分布,从而实现对时尚图像的精准解析。
衍生相关工作
CFPD数据集催生了多项经典研究工作,例如《Looking at Outfit to Parse Clothing》一文,该研究利用CFPD数据集提出了基于整体搭配的服装解析方法,显著提升了模型的解析精度。此外,许多基于深度学习的时尚图像解析模型,如FashionNet和DeepFashion,均以CFPD数据集为基础进行训练和验证,推动了时尚图像解析技术的快速发展。
数据集最近研究
最新研究方向
在时尚解析领域,CFPD数据集因其丰富的像素级标注和颜色类别信息,成为研究服装解析与识别的关键资源。近年来,随着深度学习技术的迅猛发展,该数据集被广泛应用于服装分割、颜色识别及风格分类等任务中。特别是在弱监督学习框架下,CFPD数据集通过其弱颜色类别标签,为研究者提供了探索如何在有限标注数据下提升模型性能的独特机会。此外,结合生成对抗网络(GAN)和自监督学习等前沿技术,CFPD数据集在时尚推荐系统、虚拟试衣等实际应用场景中展现出巨大潜力。其多类别、多颜色的复杂标注结构,也为跨模态学习与多任务学习提供了丰富的研究素材,推动了时尚解析技术的创新与突破。
以上内容由遇见数据集搜集并总结生成



