ImageNet-1K|图像分类数据集|深度学习数据集
收藏Soft Label Pruning for Large-scale Dataset Distillation (LPLD)
数据集概述
该数据集用于验证论文 "Are Large-scale Soft Labels Necessary for Large-scale Dataset Distillation?" 中的方法,旨在减少大规模数据集蒸馏中软标签的存储需求。
数据集内容
模型与类批量归一化 (Model with Class BN)
数据集 | 模型 | 大小 |
---|---|---|
ImageNet-1K | ResNet18 | 50.41 MB |
Tiny-ImageNet | ResNet18 | 81.30 MB |
ImageNet-21K | ResNet18 | 445.87 MB |
蒸馏图像数据集 (Distilled Image Dataset)
数据集 | 设置 | 数据集大小 |
---|---|---|
ImageNet-1K | IPC10<br>IPC20<br>IPC50<br>IPC100<br>IPC200 | 0.15 GB<br>0.30 GB<br>0.75 GB<br>1.49 GB<br>2.98 GB |
Tiny-ImageNet | IPC50<br>IPC100 | 21 MB<br>40 MB |
ImageNet-21K | IPC10<br>IPC20 | 3 GB<br>5 GB |
软标签对比 (Previous Soft Labels vs Ours)
数据集 | 设置 | 之前标签大小 | 之前模型准确率 | 我们的标签大小 | 我们的模型准确率 |
---|---|---|---|---|---|
ImageNet-1K | IPC10<br>IPC20<br>IPC50<br>IPC100<br>IPC200 | 5.67 GB<br>11.33 GB<br>28.33 GB<br>56.66 GB<br>113.33 GB | 20.1%<br>33.6%<br>46.8%<br>52.8%<br>57.0% | 0.14 GB (40x)<br>0.29 GB (40x)<br>0.71 GB (40x)<br>1.43 GB (40x)<br>2.85 GB (40x) | 20.2%<br>33.0%<br>46.7%<br>54.0%<br>59.6% |
Tiny-ImageNet | IPC50<br>IPC100 | 449 MB<br>898 MB | 41.1%<br>49.7% | 11 MB (40x)<br>22 MB (40x) | 38.4%<br>46.1% |
ImageNet-21K | IPC10<br>IPC20 | 643 GB<br>1286 GB | 18.5%<br>20.5% | 16 GB (40x)<br>32 GB (40x) | 21.3%<br>29.4% |
相关资源

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
SSDD遥感SAR目标检测数据集-COCO格式
SSDD遥感SAR目标检测数据集-COCO格式,按照官方制定方式划分训练/验证集
AI_Studio 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录