gaunernst/glint360k-wds
收藏Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gaunernst/glint360k-wds
下载链接
链接失效反馈官方服务:
资源简介:
MS-Celeb-1M (v3)数据集是在Partial FC论文中引入的,包含17,091,657张图像和360,232个ID。所有图像都基于RetinaFace预测的面部特征点进行对齐,并调整为112x112大小。数据集最初以MXNet RecordIO格式提供,在此副本中已转换为WebDataset格式,共分为500个分片。
MS-Celeb-1M (v3)数据集是在Partial FC论文中引入的,包含17,091,657张图像和360,232个ID。所有图像都基于RetinaFace预测的面部特征点进行对齐,并调整为112x112大小。数据集最初以MXNet RecordIO格式提供,在此副本中已转换为WebDataset格式,共分为500个分片。
提供机构:
gaunernst
原始信息汇总
数据集概述
基本信息
- 名称: MS-Celeb-1M (v3)
- 任务类别: 图像分类
- 大小类别: 10M<n<100M
数据详情
- 图像数量: 17,091,657
- 身份数量: 360,232
- 图像处理: 所有图像基于面部标志进行对齐,并调整大小至112x112像素。
- 原始格式: MXNet RecordIO
- 转换格式: WebDataset
- 分片数量: 500
使用示例
python import webdataset as wds
url = "https://huggingface.co/datasets/gaunernst/glint360k-wds/resolve/main/glint360k-{0000..0499}.tar" ds = wds.WebDataset(url).decode("pil").to_tuple("jpg", "cls")
img, label = next(iter(ds))
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



