PartImageNet++

Name: PartImageNet++
Creator: 清华大学
Published: 2024-07-16 01:19:50
License: 暂无描述

arXiv2024-07-16 更新2024-07-17 收录

下载链接：

https://github.com/LixiaoTHU/PartImageNetPP

下载链接

链接失效反馈

官方服务：

资源简介：

PartImageNet++是由清华大学等机构创建的一个大型数据集，专门为ImageNet-1K的所有类别提供高质量的部分分割注释。该数据集包含100,000张图像，涵盖1,000个对象类别和3,310个部分类别，旨在通过详细的部分注释方案增强模型的鲁棒性。数据集的创建过程包括手动注释和质量控制，确保注释的高质量。PartImageNet++主要应用于提高对象识别系统的鲁棒性，特别是在对抗性扰动和常见图像损坏的情况下。

PartImageNet++ is a large-scale dataset created by Tsinghua University and other institutions, which specifically provides high-quality part segmentation annotations for all categories in ImageNet-1K. This dataset contains 100,000 images, covering 1,000 object categories and 3,310 part categories, aiming to enhance the robustness of models through a detailed part annotation scheme. The creation process of the dataset includes manual annotation and quality control to ensure the high quality of annotations. PartImageNet++ is mainly applied to improving the robustness of object recognition systems, especially under adversarial perturbations and common image corruptions.

提供机构：

清华大学

创建时间：

2024-07-16

原始信息汇总

PartImageNetPP

数据集概述

名称：PartImageNetPP
来源：论文 "PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition" (ECCV 2024)
可用性：当前数据集可在 https://huggingface.co/datasets/lixiao20/PartImageNetPP 获取

引用信息

@inproceedings{li2024pinpp, author = {Li, Xiao and Liu, Yining and Dong, Na and Qin, Sitian and Hu, Xiaolin}, title = {PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition}, booktitle={European conference on computer vision}, year = {2024}, organization={Springer} }

搜集汇总

数据集介绍

构建方式

PIN++数据集的构建基于ImageNet-1K（IN-1K）的训练集，通过人工标注的方式为IN-1K中的每个类别提供高质量的部件分割标注。为了确保标注质量，研究团队设计了一套详细的标注方案，包括确定每个类别需要标注的部件、设计部件分割原则以及进行标注质量检查。由于成本限制，每个类别随机选择了100张图像进行标注，总计100K张带部件标注的图像。为了充分利用这些标注，研究团队提出了一种新的多尺度部件监督模型（MPM），该模型通过添加辅助旁路层，能够更好地利用高分辨率部件标注，并在IN-1K上直接训练。

特点

PIN++数据集的特点在于其规模大、质量高且涵盖范围广。与现有的部件数据集相比，PIN++提供了最多样化的对象类别，包括生物、人工制品、刚性和非刚性物体等。此外，PIN++是类别平衡的，保证了每个图像只包含一个前景类别。PIN++还提供了丰富的部件标注，包括3,310个部件类别和406,364个部件掩码。这些特点使得PIN++成为研究部件模型鲁棒识别和其他部件相关视觉理解任务的理想数据集。

使用方法

使用PIN++数据集进行鲁棒识别的方法包括两个步骤：首先，利用PIN++的标注训练一个部件分割网络，为IN-1K中未标注的图像生成伪部件标签；其次，训练MPM模型，该模型通过添加多尺度旁路层，能够更好地利用部件标注。在训练过程中，MPM使用部件标注和伪部件标签进行监督。在推理过程中，辅助层被丢弃，原始的识别模型给出最终的物体类别预测。PIN++数据集和代码可在https://github.com/LixiaoTHU/PartImageNetPP获得。

背景与挑战

背景概述

PartImageNet++数据集是专为提高深度学习对象识别系统的鲁棒性而创建的。该数据集由Xiao Li等研究人员于2024年提出，旨在通过提供高质量的部件分割注释来模拟人类识别过程中的部件归纳偏差，从而增强模型对对抗性扰动的鲁棒性。PartImageNet++基于广泛使用的ImageNet-1K数据集，为所有类别的图像提供了部件分割注释，使得研究人员能够在标准数据集上直接构建基于部件的鲁棒识别方法。该数据集的创建对于推动基于部件的模型在更广泛的应用中的潜力探索具有重要意义。

当前挑战

PartImageNet++数据集面临的挑战主要包括：1) 所解决的领域问题：虽然深度学习在对象识别方面取得了显著成功，但DNNs往往缺乏鲁棒性，容易受到对抗性样本、常见图像损坏和各种分布外数据的影响，这在安全关键场景中极大地阻碍了DNNs的应用。2) 构建过程中所遇到的挑战：由于缺乏部件注释，基于部件的模型的有效性仅在小型非标准数据集上得到初步验证。PartImageNet++数据集的创建和注释过程需要大量的时间和人力资源，以确保高质量的部件分割注释。

常用场景

经典使用场景

PartImageNet++ 数据集提供了一个高质量的图像分割标注，适用于研究基于部件的模型，以提高深度学习对象识别系统的鲁棒性。通过将对象分解为部件，并考虑部件的层次表示和空间关系，这些模型能够更好地模拟人类识别过程，从而提高对对抗性扰动、常见图像损坏和分布外数据集的鲁棒性。

实际应用

PartImageNet++ 数据集的实际应用场景包括安全关键的环境，如自动驾驶、医疗影像分析和人脸识别。在这些场景中，基于部件的模型能够提高模型对噪声和对抗性扰动的鲁棒性，从而提高系统的准确性和可靠性。此外，该数据集还可以用于开发新的视觉理解任务，如部件分割、物体解析和场景理解，从而推动计算机视觉领域的发展。

衍生相关工作

PartImageNet++ 数据集的提出促进了基于部件的模型的进一步研究，并衍生出了一系列相关工作。例如，MPM（多尺度部件监督模型）利用该数据集实现了更高的鲁棒性，并在常见图像损坏和分布外数据集上取得了显著的性能提升。此外，该数据集还激发了研究人员对部件分割、物体解析和场景理解等视觉理解任务的进一步探索，推动了计算机视觉领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集