D4M

github2024-07-24 更新2024-07-25 收录

下载链接：

https://github.com/suduo94/D4M

下载链接

链接失效反馈

官方服务：

资源简介：

D4M是一个通过解耦扩散模型进行数据集浓缩的高效框架，专注于创建轻量级合成数据集，用于快速网络训练，具有良好的测试准确性。该框架不依赖于匹配的架构，通过确保真实和合成图像空间的一致性来增强跨架构的泛化能力。浓缩的数据集具有多功能性，无需为不同架构重复生成不同的数据集。

D4M is an efficient framework for dataset condensation via decoupled diffusion models. It focuses on creating lightweight synthetic datasets for rapid network training with excellent test accuracy. This framework does not rely on matched architectures, and enhances cross-architecture generalization by ensuring consistency between real and synthetic image spaces. The condensed datasets are versatile, eliminating the need to repeatedly generate distinct datasets for different architectures.

创建时间：

2024-07-11

原始信息汇总

💾 D4M: Dataset Distillation via Disentangled Diffusion Model

💥 主要特点

无需优化的数据集蒸馏方式。
架构无关的数据集蒸馏过程。
高效蒸馏大规模数据集（如ImageNet-1K）。
蒸馏后的数据集质量高且多功能。

📚 简介

数据集蒸馏提供了一个轻量级的合成数据集，用于快速网络训练并具有良好的测试准确性。我们主张设计一个独立于匹配架构的经济型数据集蒸馏框架。通过实证观察，我们认为约束真实和合成图像空间的连续性将增强跨架构的泛化能力。基于此，我们引入了通过解耦扩散模型的数据集蒸馏（D4M），这是一个高效的数据集蒸馏框架。与依赖架构的方法相比，D4M采用潜在扩散模型来保证连续性，并将标签信息纳入类别原型中。蒸馏后的数据集多功能，无需为不同架构重复生成不同的数据集。通过全面的实验，D4M在大多数方面展示了优越的性能和稳健的泛化能力，超越了最先进的方法。

🔧 快速开始

创建环境

Python >=3.9
Pytorch >= 1.12.1
Torchvision >= 0.13.1

安装Diffusers库

根据指定页面安装或升级最新版本的Diffusers库。

修改Diffusers库

将管道脚本复制到Diffusers库的路径中。
根据指定文档修改Diffusers源代码。

生成原型

bash cd distillation sh gen_prototype_imgnt.sh

合成图像

bash cd distillation sh gen_syn_image_imgnt.sh

✨ 定性结果

与其他方法的比较

ImageNet-1K结果
Tiny-ImageNet结果
CIFAR-10结果
CIFAR-100结果

语义信息

同一类别内的蒸馏数据

📊 定量结果

📖 引用

@InProceedings{Su_2024_CVPR, author = {Su, Duo and Hou, Junjie and Gao, Weizhi and Tian, Yingjie and Tang, Bowen}, title = {D{ extasciicircum}4M: Dataset Distillation via Disentangled Diffusion Model}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, month = {June}, year = {2024}, pages = {5809-5818} }

搜集汇总

数据集介绍

构建方式

在数据集的构建过程中，D4M采用了一种无优化方式的蒸馏方法，通过解耦扩散模型（Disentangled Diffusion Model）来实现。该方法不仅避免了依赖特定架构的问题，还通过在潜在空间中引入扩散模型来确保真实图像与合成图像空间的一致性。此外，D4M将标签信息融入类别原型中，从而生成高质量且多样化的蒸馏数据集。这种构建方式使得D4M能够高效地处理大规模数据集，如ImageNet-1K，同时保持数据集的通用性，无需为不同架构重复生成数据集。

特点

D4M数据集的主要特点在于其无架构依赖性和高效性。通过解耦扩散模型，D4M确保了数据集在不同架构间的通用性，解决了跨架构问题。此外，D4M的蒸馏过程高效，能够快速生成高质量的合成数据集，适用于快速网络训练。数据集的多样性和高质量使得其在多个基准测试中表现优异，超越了现有的最先进方法。

使用方法

使用D4M数据集时，首先需创建适当的环境，确保Python版本不低于3.9，Pytorch版本不低于1.12.1，以及Torchvision版本不低于0.13.1。随后，安装并修改Diffusers库，按照提供的脚本路径进行操作。接着，通过执行生成原型和合成图像的脚本，完成数据集的生成。最后，进行训练时间匹配（TTM）和验证，以确保数据集的有效性和性能。整个过程简便且高效，适合快速部署和应用。

背景与挑战

背景概述

D4M数据集，全称为Dataset Distillation via Disentangled Diffusion Model，是由Su, Duo等人于2024年提出的一个创新性数据集。该数据集的核心研究问题在于通过解耦扩散模型实现数据集的高效蒸馏，旨在为快速网络训练提供高质量的合成数据集。D4M的提出不仅解决了传统数据集蒸馏方法中依赖特定架构的问题，还显著提升了跨架构的泛化能力。其研究成果在计算机视觉领域具有重要影响力，尤其是在大规模数据集如ImageNet-1K上的应用，展示了其卓越的性能和鲁棒性。

当前挑战

D4M数据集在构建过程中面临多项挑战。首先，如何在不依赖特定架构的情况下实现数据集的高效蒸馏，是一个技术难题。其次，确保合成数据集与真实数据集在图像空间的一致性，以提升跨架构的泛化能力，也是一大挑战。此外，处理大规模数据集如ImageNet-1K时，如何在保证数据质量的同时提高蒸馏效率，也是该数据集需要克服的关键问题。这些挑战不仅推动了数据集蒸馏技术的发展，也为后续研究提供了丰富的探索空间。

常用场景

经典使用场景

在计算机视觉领域，D4M数据集的经典使用场景主要体现在其高效的图像数据集蒸馏能力。通过无优化和无架构依赖的蒸馏过程，D4M能够从大规模数据集（如ImageNet-1K）中提取出高质量且多样化的合成数据集。这些合成数据集不仅加速了网络训练过程，还显著提升了测试准确性，特别适用于需要快速迭代和高效资源利用的场景。

衍生相关工作

D4M数据集的提出激发了一系列相关研究工作。例如，基于D4M的蒸馏框架，研究者们进一步探索了不同数据集的蒸馏效果，提出了多种改进的扩散模型和蒸馏算法。此外，D4M的成功应用也推动了数据集蒸馏技术在其他领域的扩展，如自然语言处理和语音识别，为这些领域的数据集优化提供了新的方向和方法。

数据集最近研究

D4M

💾 D<sup>4</sup>M: Dataset Distillation via Disentangled Diffusion Model