ImageNet32x32, ImageNet16x16, ImageNet64x64
收藏arXiv2017-08-24 更新2024-06-21 收录
下载链接:
http://image-net.org/download-images, https://github.com/PatrykChrabaszcz/Imagenet32_Scripts
下载链接
链接失效反馈官方服务:
资源简介:
ImageNet32x32、ImageNet16x16和ImageNet64x64是由弗莱堡大学创建的ImageNet数据集的降采样版本,分别包含32x32、16x16和64x64像素的图像。这些数据集保留了原始ImageNet的1000个类别和图像数量,仅图像分辨率降低。创建过程涉及将原始图像通过不同的降采样技术处理,并保持与CIFAR数据集相同的文件格式。这些数据集主要用于深度学习中的快速实验,如算法设计、神经网络架构搜索和超参数优化,旨在解决大规模数据集计算成本高昂的问题。
ImageNet32x32, ImageNet16x16, and ImageNet64x64 are downsampled variants of the ImageNet dataset developed by the University of Freiburg, with image resolutions of 32x32, 16x16, and 64x64 pixels respectively. These datasets preserve the 1000 categories and total number of images from the original ImageNet, with only the image resolution being reduced. The creation workflow entails processing the original images using various downsampling techniques, while retaining the identical file format as the CIFAR datasets. These datasets are primarily utilized for rapid deep learning experiments including algorithm design, neural architecture search, and hyperparameter optimization, aiming to address the high computational cost challenge posed by large-scale datasets.
提供机构:
弗莱堡大学
创建时间:
2017-07-27
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,大规模图像数据集对于深度神经网络的发展至关重要,但原始ImageNet的计算成本限制了实验效率。为解决这一问题,研究者通过系统化的降采样流程构建了ImageNet32x32及其变体。该数据集基于ILSVRC-2012分类数据集,采用Pillow库中的多种降采样技术,将原始图像统一缩放至32×32像素分辨率,同时完整保留了1000个类别和全部图像样本。数据预处理过程中,图像经过随机打乱后分为10个文件存储,每个文件均包含所有类别的样本,并采用与CIFAR数据集相同的文件格式,确保了数据的规范性和易用性。
特点
该数据集的核心特征在于其平衡了计算效率与任务复杂性。相较于CIFAR数据集,它保持了ImageNet完整的千类分类体系,提供了更具挑战性的视觉识别任务;而与原始ImageNet相比,其图像分辨率的大幅降低使得存储需求显著下降,实验速度可提升近百倍。值得注意的是,不同降采样方法对模型性能影响较小,但最近邻方法表现相对较差。数据集在保持类别平衡的同时,通过分辨率变化形成了16×16、32×32、64×64的系列化变体,为研究者在计算资源与模型性能之间提供了灵活的选择空间。
使用方法
该数据集主要服务于深度学习的算法验证与模型开发。研究者可将其作为ImageNet的轻量化替代,用于神经网络架构搜索、超参数优化等计算密集型实验。使用时可借鉴论文中的实验设置,采用宽残差网络作为基准模型,配合随机水平翻转、图像平移等数据增强策略。学习率设置可参考论文发现的规律,即最优学习率范围在不同分辨率变体间保持稳定。对于多保真度优化方法,该数据集可作为低成本代理,帮助快速筛选有潜力的架构和超参数配置,再迁移至高分辨率数据集进行最终验证。
背景与挑战
背景概述
在深度学习研究领域,大规模基准数据集的可用性极大地推动了算法与架构的创新。ImageNet作为经典的大规模视觉识别数据集,虽在图像分类任务上具有里程碑意义,但其高分辨率图像带来的计算负担限制了广泛实验的可行性。为此,弗莱堡大学的Patryk Chrabaszcz、Ilya Loshchilov与Frank Hutter于2017年提出了ImageNet的下采样变体——ImageNet32x32、ImageNet16x16及ImageNet64x64。这些数据集完整保留了ImageNet的1000个类别与图像数量,仅将图像分辨率分别降至32×32、16×16与64×64像素,旨在为神经网络架构设计、超参数优化等研究提供高效替代方案,填补了CIFAR系列数据集与原始ImageNet之间的复杂度空白。
当前挑战
该数据集旨在应对图像分类领域因数据规模与计算成本带来的挑战。原始ImageNet的高分辨率要求巨额计算资源,使得算法迭代与实验验证难以普及;而下采样版本通过降低图像分辨率,在保持类别复杂度的同时大幅缩减训练时间,为资源有限的研究提供了可行路径。在构建过程中,挑战主要集中于下采样技术的选择与信息保留的平衡。研究团队对比了六种下采样方法,发现除最近邻法外,其余方法性能相近,但如何最小化分辨率降低导致的信息损失,确保下采样后数据集仍能有效反映原始数据的统计特性,成为关键难题。此外,数据集的构建需维持与原始ImageNet一致的类别结构与文件格式,以保障其作为基准的兼容性与可靠性。
常用场景
经典使用场景
在计算机视觉领域,ImageNet32x32、ImageNet16x16和ImageNet64x64数据集常被用作替代CIFAR系列的高复杂度基准测试工具。这些数据集通过将原始ImageNet图像降采样至低分辨率,保留了千类别的复杂语义结构,同时大幅降低了计算开销。研究者广泛利用它们进行神经网络架构的快速原型设计、训练算法的迭代验证以及超参数调优,尤其在资源受限的环境下,这些数据集能够高效模拟原始ImageNet的挑战性,成为连接简单数据集与大规模数据集的桥梁。
解决学术问题
该数据集有效解决了深度学习研究中因计算资源限制而难以大规模实验的瓶颈问题。通过提供与原始ImageNet相同类别和图像数量的低分辨率版本,它使得学者能够在有限硬件条件下探索复杂视觉任务的泛化性能。其意义在于推动了神经网络架构搜索与超参数优化方法的发展,为多保真度优化算法提供了廉价而可靠的代理基准,从而加速了视觉模型从理论到实践的转化进程。
衍生相关工作
基于这些数据集,衍生了一系列经典研究工作,特别是在神经网络架构搜索与高效训练策略领域。例如,研究者利用ImageNet32x32验证了宽残差网络在不同分辨率下的扩展性,并启发了多保真度超参数优化方法(如Hyperband)的进一步发展。此外,这些数据集还促进了低分辨率图像分类的理论探索,为后续的模型压缩、知识蒸馏等方向提供了基准支持,推动了视觉计算向更高效、更普适的方向演进。
以上内容由遇见数据集搜集并总结生成



