Dataset Distillation using Diffusion Models (D3M)
收藏arXiv2024-03-12 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.07142v1
下载链接
链接失效反馈官方服务:
资源简介:
D3M数据集是由范德堡大学开发的,用于深度神经网络训练的数据集精简技术。该数据集利用扩散模型和文本反转技术,将大规模数据集的信息压缩成更小但代表性强的合成样本集。D3M旨在解决存储和传输大量数据的问题,通过创建一个小的合成样本子集,使模型在训练时能达到与整个数据集相当的性能。数据集的应用领域包括计算机视觉基准数据集,旨在提高数据处理效率和解决版权及隐私问题。
The D3M dataset is a dataset compression technique developed by Vanderbilt University for deep neural network training. It leverages diffusion models and text inversion technologies to compress information from large-scale datasets into a smaller yet highly representative synthetic sample set. Aimed at addressing the issues of storing and transmitting massive volumes of data, D3M enables models to achieve performance comparable to that trained on the full original dataset by creating a small subset of synthetic samples. Its application domains include computer vision benchmark datasets, with the objectives of enhancing data processing efficiency and resolving copyright and privacy concerns.
提供机构:
范德堡大学
创建时间:
2024-03-12
搜集汇总
数据集介绍

背景与挑战
背景概述
D3M数据集是由范德堡大学开发的数据集精简技术,利用扩散模型和文本反转技术将大规模数据集压缩成更小但代表性强的合成样本集。该数据集旨在解决存储和传输大量数据的问题,通过小合成样本子集使模型训练达到与整个数据集相当的性能,应用领域包括计算机视觉基准数据集,以提高数据处理效率并解决版权及隐私问题。
以上内容由遇见数据集搜集并总结生成



