ImageNet-21K

Name: ImageNet-21K
Creator: 穆罕默德·本·扎耶德人工智能大学
Published: 2023-12-01 02:59:56
License: 暂无描述

arXiv2023-12-01 更新2024-07-24 收录

下载链接：

https://github.com/VILA-Lab/SRe2L/tree/main/CDA

下载链接

链接失效反馈

官方服务：

资源简介：

ImageNet-21K数据集由穆罕默德·本·扎耶德人工智能大学创建，旨在通过生成一个较小但具有代表性的子集，从大型数据集中提取关键信息，以提高模型训练效率。该数据集包含20个IPC，通过链接可访问。数据集创建过程中采用了课程数据增强（CDA）技术，有效提升了合成数据的准确性。该数据集主要应用于解决大规模数据集的存储和计算挑战，支持资源有限的科研人员参与前沿模型训练和应用开发，同时有助于缓解数据隐私问题。

The ImageNet-21K dataset was developed by Mohamed bin Zayed University of Artificial Intelligence. It aims to extract critical information from large-scale datasets by generating a small yet representative subset, thereby improving model training efficiency. The dataset contains 20 IPC categories and is accessible via links. Course Data Augmentation (CDA) technology was adopted during the dataset creation process, which effectively enhanced the accuracy of synthetic data. This dataset is primarily used to address the storage and computational challenges of large-scale datasets, enabling researchers with limited resources to participate in cutting-edge model training and application development, while also helping to mitigate data privacy issues.

提供机构：

穆罕默德·本·扎耶德人工智能大学

创建时间：

2023-12-01

搜集汇总

数据集介绍

构建方式

ImageNet-21K 数据集的构建旨在通过数据蒸馏技术，将庞大的原始数据集转化为一个更小但具有代表性的子集。该方法利用了课程数据增强（CDA）策略，在数据合成阶段逐步更新图像的局部区域，从而在保持数据集核心特征的同时，大幅度减小数据集规模。CDA 通过调整随机裁剪的上下界，使得模型从简单到困难或从困难到简单地学习图像的不同部分，从而提高了合成数据的整体质量。

特点

ImageNet-21K 数据集的特点在于其高效的数据蒸馏方法，能够在保持较高准确率的同时，将数据集压缩至原始规模的50倍。该数据集在 ImageNet-1K 和 21K 上均取得了超越现有方法的准确率，尤其是在 ImageNet-21K 上，首次实现了在标准 224×224 分辨率下的数据蒸馏。此外，CDA 方法在合成数据时，能够有效地模拟课程学习的进程，逐步提高学习难度，避免了模型过早陷入局部最优，提高了模型的泛化能力。

使用方法

使用 ImageNet-21K 数据集的方法主要分为三个阶段：首先是预训练阶段，使用大型模型对原始数据集进行训练，以获取丰富的特征信息；其次是数据恢复/合成阶段，通过 CDA 策略逐步更新图像的局部区域，生成具有代表性的合成数据；最后是后训练阶段，使用生成的小型数据集对模型进行训练，以实现与全数据集训练相当的性能。使用时，可以根据实际需求选择合适的模型架构和训练参数，以获得最佳的训练效果。

背景与挑战

背景概述

ImageNet-21K数据集是由Zeyuan Yin、Zhiqiang Shen等研究人员在2023年11月发表的研究成果。该数据集的创建旨在解决大规模数据集的存储、计算和处理挑战，同时确保模型在训练过程中能够保持高效性和准确性。ImageNet-21K数据集通过数据蒸馏技术，从原始的ImageNet数据集中提取出一个更小但具有代表性的子集，使得模型能够在原始测试数据分布上进行评估，并实现令人满意的性能。该数据集的研究背景主要关注于数据蒸馏技术，特别是如何在大规模数据集上进行高效的数据蒸馏。这一研究成果对相关领域产生了重要的影响，为研究人员提供了在大数据时代进行高效数据训练和应用开发的可能性。

当前挑战

ImageNet-21K数据集所面临的挑战主要包括：1)所解决的领域问题的挑战：如何在大规模数据集上进行高效的数据蒸馏，以便在保持模型准确性的同时降低存储、计算和处理成本；2)构建过程中所遇到的挑战：如何在数据蒸馏过程中保持数据的代表性和多样性，以便模型能够学习到原始数据集中的关键特征。此外，数据蒸馏技术本身也面临着一些挑战，例如如何平衡数据压缩与模型性能之间的关系，以及如何确保数据蒸馏过程中不会丢失原始数据集中的关键信息。

常用场景

经典使用场景

ImageNet-21K数据集作为大规模视觉识别数据集，其经典使用场景包括在计算机视觉领域进行模型训练和评估。通过在ImageNet-21K上进行预训练，模型能够捕捉到丰富的视觉特征和概念，从而在下游任务中展现出优越的性能。此外，该数据集也常用于研究数据蒸馏技术，旨在从大规模数据集中提取出更具代表性的子集，以实现高效且性能不减的训练。

衍生相关工作

ImageNet-21K数据集的衍生相关工作包括数据蒸馏技术的研究。研究者们致力于开发更高效、更准确的数据蒸馏方法，以从大规模数据集中提取出更具代表性的子集。此外，该数据集也常用于研究模型泛化能力，旨在提高模型在未知数据集上的性能。在数据蒸馏技术方面，研究者们提出了多种方法，例如基于元模型匹配、梯度匹配、分布匹配和轨迹匹配等。这些方法在实际应用中取得了显著的成果，为大规模视觉识别模型的训练和应用提供了重要的支持。

数据集最近研究