有没有相关的论文或文献参考? 
这个数据集是基于什么背景创建的? 
数据集的作者是谁? 
能帮我联系到这个数据集的作者吗? 
这个数据集如何下载? 

该数据集用于验证论文 "Are Large-scale Soft Labels Necessary for Large-scale Dataset Distillation?" 中的方法,旨在减少大规模数据集蒸馏中软标签的存储需求。
| 数据集 | 模型 | 大小 | 
|---|---|---|
| ImageNet-1K | ResNet18 | 50.41 MB | 
| Tiny-ImageNet | ResNet18 | 81.30 MB | 
| ImageNet-21K | ResNet18 | 445.87 MB | 
| 数据集 | 设置 | 数据集大小 | 
|---|---|---|
| ImageNet-1K | IPC10<br>IPC20<br>IPC50<br>IPC100<br>IPC200 | 0.15 GB<br>0.30 GB<br>0.75 GB<br>1.49 GB<br>2.98 GB | 
| Tiny-ImageNet | IPC50<br>IPC100 | 21 MB<br>40 MB | 
| ImageNet-21K | IPC10<br>IPC20 | 3 GB<br>5 GB | 
| 数据集 | 设置 | 之前标签大小 | 之前模型准确率 | 我们的标签大小 | 我们的模型准确率 | 
|---|---|---|---|---|---|
| ImageNet-1K | IPC10<br>IPC20<br>IPC50<br>IPC100<br>IPC200 | 5.67 GB<br>11.33 GB<br>28.33 GB<br>56.66 GB<br>113.33 GB | 20.1%<br>33.6%<br>46.8%<br>52.8%<br>57.0% | 0.14 GB (40x)<br>0.29 GB (40x)<br>0.71 GB (40x)<br>1.43 GB (40x)<br>2.85 GB (40x) | 20.2%<br>33.0%<br>46.7%<br>54.0%<br>59.6% | 
| Tiny-ImageNet | IPC50<br>IPC100 | 449 MB<br>898 MB | 41.1%<br>49.7% | 11 MB (40x)<br>22 MB (40x) | 38.4%<br>46.1% | 
| ImageNet-21K | IPC10<br>IPC20 | 643 GB<br>1286 GB | 18.5%<br>20.5% | 16 GB (40x)<br>32 GB (40x) | 21.3%<br>29.4% | 

rpi_test
该数据集为HuggingFace LeRobot格式机器人数据集。
huggingface 收录
NIST Thermochemical Database
NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。
webbook.nist.gov 收录
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
VEDAI
用于训练YOLO模型的VEDAI数据集,包含图像和标签,用于目标检测和跟踪。
github 收录