gaunernst/ms1mv3-wds|人脸识别数据集|图像分类数据集
收藏数据集概述
数据集名称
- 名称: MS-Celeb-1M
数据集类别
- 任务类别: 图像分类
- 大小类别: 1M<n<10M
数据集详情
- 图像数量: 5,179,510
- 身份数量: 93,431
- 图像处理: 所有图像基于面部地标由RetinaFace预测并调整大小至112x112
- 原始格式: MXNet RecordIO
- 当前格式: WebDataset
- 分片数量: 100
数据集来源
- 下载自:
https://github.com/deepinsight/insightface/tree/master/recognition/_datasets_
(MS1M-RetinaFace)
使用示例
python import webdataset as wds
url = "https://huggingface.co/datasets/gaunernst/ms1mv3-wds/resolve/main/ms1mv3-{{0000..0099}}.tar" ds = wds.WebDataset(url).decode("pil").to_tuple("jpg", "cls")
img, label = next(iter(ds))
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
Sleep
该数据集包含关于睡眠效率和持续时间的信息,每个条目代表一个独特的睡眠体验,并包括ID、年龄、性别、睡眠持续时间、睡眠效率、REM睡眠百分比、深度睡眠百分比、轻度睡眠百分比、觉醒次数、咖啡因消费、酒精消费和吸烟状况等列。
github 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录