sradc/imagenet_resized_64x64

Name: sradc/imagenet_resized_64x64
Creator: sradc
Published: 2023-08-17 14:09:02
License: 暂无描述

Hugging Face2023-08-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/sradc/imagenet_resized_64x64

下载链接

链接失效反馈

官方服务：

资源简介：

`imagenet_resized/64x64`数据集是从TensorFlow数据集中上传的，并且在上传前进行了打乱处理。该数据集是ImageNet的衍生版本，图像被调整为64x64像素，包含训练集和验证集，分别有1,281,167和50,000个样本。标签的整数定义与TensorFlow数据集中的其他ImageNet数据集不同，并且原始标签是1索引的，在此数据集中被转换为0索引。

The `imagenet_resized/64x64` dataset is uploaded from Tensorflow datasets, containing 1,281,167 training samples and 50,000 validation samples. Each sample consists of a 64x64 color image and an integer label. This dataset is a derivative of ImageNet, with labels defined by the authors and not matching those from other ImageNet datasets provided by Tensorflow datasets. The labels are originally 1-indexed, which we convert to 0-indexed by subtracting one.

提供机构：

sradc

原始信息汇总

数据集概述

数据来源

数据集 imagenet_resized/64x64 源自 TensorFlow Datasets，上传前已进行随机打乱。
该数据集是 ImageNet 的一个衍生版本，可在 ImageNet 官方网站下载。

数据格式

数据格式如下： json { "image": Array3D(shape=(64, 64, 3), dtype="uint8"), "label": Value(dtype="int32"), }

数据集划分

训练集：1,281,167 个样本
验证集：50,000 个样本

标签说明

数据集的整数标签由作者定义，与其他 ImageNet 数据集提供的标签不匹配。
原始作者的标签从1开始索引，本数据集将其转换为从0开始索引，即减去1。

搜集汇总

数据集介绍

构建方式

sradc/imagenet_resized_64x64数据集的构建，基于原始ImageNet数据库，经过尺寸调整至64x64像素，并对数据进行了随机洗牌处理。该数据集的构建遵循了tensorflow datasets中imagenet_resized的标准，并对其标签系统进行了适应性调整，以确保索引从0开始，符合数据处理的一般习惯。

特点

该数据集具备以下显著特点：首先，数据规模宏大，包含训练集1,281,167个样本和验证集50,000个样本；其次，图像经过标准化处理，便于模型快速适应；最后，标签系统的独特性使其与其它ImageNet数据集区分开来，提供了独特的研究价值。

使用方法

在使用sradc/imagenet_resized_64x64数据集时，用户需注意其数据格式为{'image': Array3D, 'label': int}，其中Array3D代表三通道的64x64像素图像，标签为整数型。用户可以直接加载训练集和验证集进行模型训练和验证，同时需关注标签系统的特殊性，以确保数据处理的一致性。

背景与挑战

背景概述

在深度学习与计算机视觉领域，ImageNet数据集作为一项里程碑式的研究成果，自2009年由斯坦福大学的李飞飞教授团队创建以来，一直扮演着至关重要的角色。该数据集以其庞大的规模、精细的标注和广泛的覆盖范围，为图像识别任务提供了丰富的资源。sradc/imagenet_resized_64x64数据集是对原始ImageNet数据集的一个衍生版本，通过重置图像大小为64x64像素，便于在计算资源受限的场合中使用。其继承了ImageNet的核心研究问题——图像分类，并对相关领域产生了深远的影响。

当前挑战

尽管ImageNet数据集在推动图像识别领域的发展上功不可没，但在构建与使用过程中也面临着诸多挑战。首先，数据集的构建过程中遇到了标注一致性、数据清洗和处理的难题。其次，由于数据集规模庞大，导致存储、传输和计算成本高昂。此外，该数据集的整数标签定义与Tensorflow datasets中的其他ImageNet数据集不兼容，增加了跨数据集比较和迁移学习的复杂性。在领域问题上，图像分类面临着类别间边界模糊、光照变化、视角差异等自然场景下的识别挑战。

常用场景

经典使用场景

在深度学习领域，sradc/imagenet_resized_64x64数据集常被用于图像识别与分类任务中，其以64x64像素的图像规模，为研究者提供了一个便捷的测试平台，以评估算法在小尺寸图像上的表现。

解决学术问题

该数据集有效解决了图像识别研究中对于大规模、多样化图像数据的需求，其涵盖的丰富图像类别为算法训练提供了强有力的支持，同时也使得标签错配问题得以凸显，促使研究者关注标签一致性问题。

衍生相关工作

基于sradc/imagenet_resized_64x64数据集，研究者们衍生出了一系列相关工作，包括但不限于图像分类算法的改进、图像数据增强技术的开发以及针对特定领域的定制化模型构建等，推动了计算机视觉领域的进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集