axiong/imagenet-r

Name: axiong/imagenet-r
Creator: axiong
Published: 2024-06-19 06:50:57
License: 暂无描述

Hugging Face2024-06-19 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/axiong/imagenet-r

下载链接

链接失效反馈

官方服务：

资源简介：

ImageNet-R（rendition）包含了艺术、卡通、刺绣、涂鸦、图形、折纸、绘画、图案、塑料制品、毛绒制品、雕塑、素描、纹身、玩具和视频游戏等多种形式的ImageNet类别图像。该数据集包含了200个ImageNet类别的30,000张图像。ImageNet-R是由Dan Hendrycks等人在ICCV 2021上提出的，旨在评估各种预训练模型的性能。

ImageNet-R (rendition) contains art, cartoons, deviantart, graffiti, embroidery, graphics, origami, paintings, patterns, plastic objects, plush objects, sculptures, sketches, tattoos, toys, and video game renditions of ImageNet classes. The dataset includes 30,000 images across 200 ImageNet classes. ImageNet-R was proposed by Dan Hendrycks et al. at ICCV 2021 to facilitate the evaluation of various pretraining models.

提供机构：

axiong

原始信息汇总

ImageNet-R 数据集概述

数据集简介

ImageNet-R(endition) 包含艺术、卡通、deviantart、涂鸦、刺绣、图形、折纸、绘画、图案、塑料制品、毛绒玩具、雕塑、素描、纹身、玩具和视频游戏中的 ImageNet 类别再现。

ImageNet-R 包含 200 个 ImageNet 类别的再现，共计 30,000 张图像。

数据集结构

特征

image: 图像数据，数据类型为 image。
wnid: WordNet ID，用于指示类别标签，数据类型为 string。
class_name: 对应的类别名称，数据类型为 string。

数据分割

test: 测试集，包含 30,000 个样本，总大小为 2,355,062,808 字节。

数据文件

test: 测试集数据文件路径为 test/test-*。

示例数据

json [ { "image": <PIL Image>, "wnid": "n02088094", "class_name": "afghan_hound" }, { "image": <PIL Image>, "wnid": "n07697537", "class_name": "hotdog" } ]

引用

bibtex @article{hendrycks2021many, title={The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization}, author={Dan Hendrycks and Steven Basart and Norman Mu and Saurav Kadavath and Frank Wang and Evan Dorundo and Rahul Desai and Tyler Zhu and Samyak Parajuli and Mike Guo and Dawn Song and Jacob Steinhardt and Justin Gilmer}, journal={ICCV}, year={2021} }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，为评估模型在分布外泛化能力，ImageNet-R数据集应运而生。该数据集基于ImageNet的200个类别，精心收集了30,000幅图像，涵盖艺术、卡通、涂鸦、刺绣、绘画、雕塑等多种艺术表现形式。构建过程严格遵循官方实现，确保数据来源的可靠性与一致性，为研究模型对非自然图像的识别能力提供了标准化测试基准。

特点

ImageNet-R数据集以其独特的艺术化渲染图像而著称，这些图像模拟了现实世界中多样的视觉表现形式，如玩具、图案、电子游戏画面等。数据集包含200个ImageNet类别，每个类别均以多种非真实感风格呈现，有效挑战了模型对传统自然图像的依赖。其结构清晰，每幅图像均标注有WordNet标识符和类别名称，便于研究者进行细粒度分析。

使用方法

使用该数据集时，研究者可通过Hugging Face的datasets库便捷加载，调用load_dataset('axiong/imagenet-r')即可获取测试集。数据以图像与标签对的形式组织，支持直接输入预训练模型进行性能评估。该数据集专为测试模型在分布外场景下的鲁棒性设计，适用于计算机视觉领域的泛化能力研究，为学术实验提供了高效、标准化的数据接口。

背景与挑战

背景概述

在计算机视觉领域，模型的鲁棒性与泛化能力一直是核心研究议题。ImageNet-R数据集由Dan Hendrycks等研究人员于2021年提出，旨在评估预训练模型在分布外泛化任务上的表现。该数据集涵盖了艺术、卡通、涂鸦、刺绣、绘画等多种艺术表现形式，共包含200个ImageNet类别的30,000张图像，为研究模型在面对风格、纹理及语义变化时的稳定性提供了重要基准。其诞生标志着视觉识别研究从传统图像分类向复杂现实场景泛化能力探索的深化，对推动鲁棒机器学习的发展具有显著影响力。

当前挑战

ImageNet-R数据集致力于解决模型在分布外泛化中的核心挑战，即如何使模型在面对艺术化、风格化或非真实感图像时仍能保持准确的识别能力。这些图像与原始ImageNet数据在视觉特征上存在显著差异，对模型的语义理解与特征不变性提出了更高要求。在构建过程中，研究人员需从多样化的艺术来源中收集并标注图像，确保类别平衡与语义一致性，同时避免引入标注偏差，这一过程涉及复杂的质量控制与数据清洗工作。

常用场景

经典使用场景

在计算机视觉领域，ImageNet-R数据集作为评估模型鲁棒性的关键工具，广泛应用于图像分类任务中。该数据集通过汇集艺术、卡通、涂鸦、刺绣等多种非自然图像风格，模拟了现实世界中的分布外泛化场景。研究者常利用它来测试预训练模型在面对风格变异时的性能表现，从而深入探究模型对视觉域变化的适应能力。

实际应用

在实际应用层面，ImageNet-R为自动驾驶、医疗影像分析等关键领域提供了重要的验证平台。例如，在自动驾驶系统中，车辆需要识别各种天气条件下或艺术化交通标志；在医疗领域，模型需适应不同成像设备产生的风格差异。该数据集帮助工程师评估模型在复杂环境中的可靠性，提升AI系统在真实场景中的部署安全性。

衍生相关工作

基于ImageNet-R的学术探索催生了多项经典研究工作。Hendrycks等人提出的鲁棒性分析框架成为该领域的奠基之作，后续研究如域泛化算法设计、风格不变特征学习等方法均以此数据集为基准。这些工作不仅深化了对神经网络泛化机制的理解，还促进了预训练模型在跨域任务中的技术革新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集