five

gaunernst/glint360k-wds

收藏
Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gaunernst/glint360k-wds
下载链接
链接失效反馈
官方服务:
资源简介:
MS-Celeb-1M (v3)数据集是在Partial FC论文中引入的,包含17,091,657张图像和360,232个ID。所有图像都基于RetinaFace预测的面部特征点进行对齐,并调整为112x112大小。数据集最初以MXNet RecordIO格式提供,在此副本中已转换为WebDataset格式,共分为500个分片。

MS-Celeb-1M (v3)数据集是在Partial FC论文中引入的,包含17,091,657张图像和360,232个ID。所有图像都基于RetinaFace预测的面部特征点进行对齐,并调整为112x112大小。数据集最初以MXNet RecordIO格式提供,在此副本中已转换为WebDataset格式,共分为500个分片。
提供机构:
gaunernst
原始信息汇总

数据集概述

基本信息

  • 名称: MS-Celeb-1M (v3)
  • 任务类别: 图像分类
  • 大小类别: 10M<n<100M

数据详情

  • 图像数量: 17,091,657
  • 身份数量: 360,232
  • 图像处理: 所有图像基于面部标志进行对齐,并调整大小至112x112像素。
  • 原始格式: MXNet RecordIO
  • 转换格式: WebDataset
  • 分片数量: 500

使用示例

python import webdataset as wds

url = "https://huggingface.co/datasets/gaunernst/glint360k-wds/resolve/main/glint360k-{0000..0499}.tar" ds = wds.WebDataset(url).decode("pil").to_tuple("jpg", "cls")

img, label = next(iter(ds))

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作