face-obfuscated-imagenet
收藏数据集概述:Face-Obfuscated-Imagenet
数据集简介
- 目的:提供隐私增强的ILSVRC2012 ImageNet变体,支持大规模图像分类研究同时保护隐私。
- 特点:包含原始及人脸模糊处理的子集,适用于不同规模的研究需求。
使用条款
- 限制:仅限经批准的学术或研究用户,用于非商业研究及教育目的。
- 禁止:禁止重新分发或外部托管原始图像数据。
- 访问流程:
- 访问ImageNet下载页面注册。
- 阅读并接受使用条款。
- 申请ILSVRC2012访问权限。
- 获批后使用本数据集。
数据集详情
子集配置
- 1k:标准ILSVRC2012,1000类约120万图像。
- 100:精选100类,加速实验。
- 10 (Imagenette):10个易分类别,快速原型设计。
- noface-1k/100/10:对应子集的人脸模糊版本。
数据统计
| 版本 | 训练图像(模糊数) | 验证图像(模糊数) |
|---|---|---|
| 1k (noface_1k) | 1,281,167 (1,281,066) | 50,000 (49,997) |
| 100 (noface_100) | 126,689 (126,683) | 5,000 (4,999) |
| 10 (noface_10) | 12,894 (12,893) | 500 (500) |
数据来源
- 原始数据:ImageNet Challenge 2012(Russakovsky等,2015)。
- 人脸模糊处理:Face Obfuscation Project(Yang等,2022)。
使用示例
python import datasets from aiohttp import ClientTimeout
dataset_name = "randall-lab/face-obfuscated-imagenet" timeout_period = 500000 storage_options = {"client_kwargs": {"timeout": ClientTimeout(total=timeout_period)}}
dataset_names = ["1k", "100", "10", "noface-1k", "noface-100", "noface-10"]
for name in dataset_names: for split in ["train", "validation"]: dataset = datasets.load_dataset( dataset_name, name=name, split=split, trust_remote_code=True, storage_options=storage_options, )
引用
bibtex @article{russakovsky2015imagenet, title={Imagenet large scale visual recognition challenge}, author={Russakovsky, Olga and others}, journal={International journal of computer vision}, year={2015} } @inproceedings{yang2022study, title={A Study of Face Obfuscation in ImageNet}, author={Yang, Kaiyu and others}, booktitle={ICML}, year={2022} }




