Clothing1M
收藏魔搭社区2025-12-25 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/Clothing1M
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Clothing1M
license:
- Unknown
mediaTypes:
- Image
paperUrl: http://openaccess.thecvf.com/content_cvpr_2015/papers/Xiao_Learning_From_Massive_2015_CVPR_paper.pdf
publishDate: "2015"
publishUrl: https://github.com/Cysu/noisy_label
publisher:
- Baidu
- Chinese University of Hong Kong
tags:
- Clothing
taskTypes:
- Image Classification
- Learning With Noisy Labels
---
# 数据集介绍
## 简介
Clothing1M 包含 14 个类别的 1M 服装图像。这是一个带有嘈杂标签的数据集,因为数据是从几个在线购物网站收集的,并且包含许多错误标签的样本。该数据集还包含 50k、14k 和 10k 图像,这些图像具有干净的标签,分别用于训练、验证和测试。
## 引文
```
@inproceedings{xiao2015learning,
title={Learning from massive noisy labeled data for image classification},
author={Xiao, Tong and Xia, Tian and Yang, Yi and Huang, Chang and Wang, Xiaogang},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={2691--2699},
year={2015}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: Clothing1M
许可证:未知
媒体类型:图像
论文链接:http://openaccess.thecvf.com/content_cvpr_2015/papers/Xiao_Learning_From_Massive_2015_CVPR_paper.pdf
发布日期:2015年
发布链接:https://github.com/Cysu/noisy_label
发布方:百度(Baidu)、香港中文大学(Chinese University of Hong Kong)
标签:服装
任务类型:图像分类(Image Classification)、带噪标签学习(Learning With Noisy Labels)
---
# 数据集介绍
## 简介
Clothing1M 数据集包含覆盖14个类别的100万张服装图像。由于该数据集采集自多家在线购物平台,其中存在大量标签错误的样本,因此属于带噪标签数据集。此外,该数据集还分别提供了5万、1.4万和1万张带有干净标签的图像,分别用于模型训练、验证与测试。
## 引文
@inproceedings{xiao2015learning,
title={Learning from massive noisy labeled data for image classification},
author={Xiao, Tong and Xia, Tian and Yang, Yi and Huang, Chang and Wang, Xiaogang},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={2691--2699},
year={2015}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-14
搜集汇总
数据集介绍

背景与挑战
背景概述
Clothing1M是一个大规模服装图像数据集,包含100万张图像,覆盖14个类别,其标签存在噪声,因为数据来自在线购物网站,包含许多错误标记的样本。此外,数据集提供了5万张训练图像、1.4万张验证图像和1万张测试图像,这些子集具有干净标签,适用于模型评估和优化。
以上内容由遇见数据集搜集并总结生成



