sradc/imagenet_resized_64x64
收藏Hugging Face2023-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sradc/imagenet_resized_64x64
下载链接
链接失效反馈官方服务:
资源简介:
`imagenet_resized/64x64`数据集是从TensorFlow数据集中上传的,并且在上传前进行了打乱处理。该数据集是ImageNet的衍生版本,图像被调整为64x64像素,包含训练集和验证集,分别有1,281,167和50,000个样本。标签的整数定义与TensorFlow数据集中的其他ImageNet数据集不同,并且原始标签是1索引的,在此数据集中被转换为0索引。
The `imagenet_resized/64x64` dataset is uploaded from Tensorflow datasets, containing 1,281,167 training samples and 50,000 validation samples. Each sample consists of a 64x64 color image and an integer label. This dataset is a derivative of ImageNet, with labels defined by the authors and not matching those from other ImageNet datasets provided by Tensorflow datasets. The labels are originally 1-indexed, which we convert to 0-indexed by subtracting one.
提供机构:
sradc
原始信息汇总
数据集概述
数据来源
- 数据集
imagenet_resized/64x64源自 TensorFlow Datasets,上传前已进行随机打乱。 - 该数据集是 ImageNet 的一个衍生版本,可在 ImageNet 官方网站 下载。
数据格式
- 数据格式如下: json { "image": Array3D(shape=(64, 64, 3), dtype="uint8"), "label": Value(dtype="int32"), }
数据集划分
- 训练集:1,281,167 个样本
- 验证集:50,000 个样本
标签说明
- 数据集的整数标签由作者定义,与其他 ImageNet 数据集提供的标签不匹配。
- 原始作者的标签从1开始索引,本数据集将其转换为从0开始索引,即减去1。
搜集汇总
数据集介绍

构建方式
sradc/imagenet_resized_64x64数据集的构建,基于原始ImageNet数据库,经过尺寸调整至64x64像素,并对数据进行了随机洗牌处理。该数据集的构建遵循了tensorflow datasets中imagenet_resized的标准,并对其标签系统进行了适应性调整,以确保索引从0开始,符合数据处理的一般习惯。
特点
该数据集具备以下显著特点:首先,数据规模宏大,包含训练集1,281,167个样本和验证集50,000个样本;其次,图像经过标准化处理,便于模型快速适应;最后,标签系统的独特性使其与其它ImageNet数据集区分开来,提供了独特的研究价值。
使用方法
在使用sradc/imagenet_resized_64x64数据集时,用户需注意其数据格式为{'image': Array3D, 'label': int},其中Array3D代表三通道的64x64像素图像,标签为整数型。用户可以直接加载训练集和验证集进行模型训练和验证,同时需关注标签系统的特殊性,以确保数据处理的一致性。
背景与挑战
背景概述
在深度学习与计算机视觉领域,ImageNet数据集作为一项里程碑式的研究成果,自2009年由斯坦福大学的李飞飞教授团队创建以来,一直扮演着至关重要的角色。该数据集以其庞大的规模、精细的标注和广泛的覆盖范围,为图像识别任务提供了丰富的资源。sradc/imagenet_resized_64x64数据集是对原始ImageNet数据集的一个衍生版本,通过重置图像大小为64x64像素,便于在计算资源受限的场合中使用。其继承了ImageNet的核心研究问题——图像分类,并对相关领域产生了深远的影响。
当前挑战
尽管ImageNet数据集在推动图像识别领域的发展上功不可没,但在构建与使用过程中也面临着诸多挑战。首先,数据集的构建过程中遇到了标注一致性、数据清洗和处理的难题。其次,由于数据集规模庞大,导致存储、传输和计算成本高昂。此外,该数据集的整数标签定义与Tensorflow datasets中的其他ImageNet数据集不兼容,增加了跨数据集比较和迁移学习的复杂性。在领域问题上,图像分类面临着类别间边界模糊、光照变化、视角差异等自然场景下的识别挑战。
常用场景
经典使用场景
在深度学习领域,sradc/imagenet_resized_64x64数据集常被用于图像识别与分类任务中,其以64x64像素的图像规模,为研究者提供了一个便捷的测试平台,以评估算法在小尺寸图像上的表现。
解决学术问题
该数据集有效解决了图像识别研究中对于大规模、多样化图像数据的需求,其涵盖的丰富图像类别为算法训练提供了强有力的支持,同时也使得标签错配问题得以凸显,促使研究者关注标签一致性问题。
衍生相关工作
基于sradc/imagenet_resized_64x64数据集,研究者们衍生出了一系列相关工作,包括但不限于图像分类算法的改进、图像数据增强技术的开发以及针对特定领域的定制化模型构建等,推动了计算机视觉领域的进步。
以上内容由遇见数据集搜集并总结生成



