Dataset Distillation
收藏arXiv2020-02-25 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1811.10959v3
下载链接
链接失效反馈官方服务:
资源简介:
数据集蒸馏是一种创新的数据处理技术,由麻省理工学院计算机科学与人工智能实验室开发。该技术旨在将大型训练数据集的知识压缩到一个小型合成数据集中,例如将60,000个MNIST训练图像压缩为仅10个合成图像(每类一个)。这些合成图像虽不源自原始数据分布,但用于训练时能接近原始数据集的性能。数据集蒸馏技术适用于多种初始化设置和学习目标,已在多个公开数据集上展示了其优越性,主要用于解决数据压缩和模型训练效率问题。
提供机构:
麻省理工学院计算机科学与人工智能实验室
创建时间:
2018-11-27



