Intra-AFruit

Name: Intra-AFruit
Creator: 墨尔本大学
Published: 2023-11-07 19:38:32
License: 暂无描述

arXiv2023-11-07 更新2024-06-21 收录

下载链接：

https://github.com/saraao/amodal-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Intra-AFruit是由墨尔本大学创建的一个大型合成数据集，专注于水果和蔬菜的类内遮挡场景。该数据集包含255,000张图像，每张图像都标注了多种类型的掩码、边界框、双重顺序关系以及完整的外观信息。数据集的创建过程利用了自动数据合成技术，确保了标注的准确性和详细性。Intra-AFruit不仅适用于类内实例分割任务，还支持其他与类内遮挡相关的任务，如遮挡对象的顺序感知和不可见部分纹理的推断。该数据集的应用领域包括自动化收获、机器人库存建设和水果质量控制，旨在解决类内遮挡场景下的视觉感知问题。

Intra-AFruit is a large-scale synthetic dataset developed by the University of Melbourne, focusing on intra-class occlusion scenarios involving fruits and vegetables. This dataset comprises 255,000 images, each annotated with multiple types of masks, bounding boxes, dual sequential relationships, and comprehensive appearance information. The dataset’s creation process leverages automated data synthesis techniques to ensure the accuracy and thoroughness of its annotations. Intra-AFruit is applicable not only to intra-class instance segmentation tasks, but also supports other occlusion-related tasks such as order perception of occluded objects and texture inference for invisible parts. Its application fields include automated harvesting, robotic inventory construction, and fruit quality control, aiming to address visual perception challenges in intra-class occlusion scenarios.

提供机构：

墨尔本大学

创建时间：

2023-03-12

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，处理密集同类物体遮挡场景的模态感知任务面临数据稀缺的挑战。Intra-AFruit数据集通过合成方法构建，以应对这一难题。该数据集利用Fruits-360中的水果与蔬菜图像作为前景对象，并采用DTD纹理数据库中的图像作为背景，通过层次化合成流程自动生成图像。每个图像包含2至5个同一类别的实例，这些实例以随机旋转角度和尺寸排列，以模拟真实的同类遮挡场景。在生成过程中，系统自动为每个实例提供可见掩码、不可见掩码及模态掩码等多类标注，同时记录实例的层次顺序与遮挡关系，并保留每个实例的完整外观图像。通过这一自动化流程，数据集最终包含超过25.5万张图像，确保了标注的准确性与一致性。

特点

Intra-AFruit数据集在模态实例分割领域中展现出独特优势，其核心特点在于专注于密集同类遮挡场景的建模。该数据集涵盖10类水果与蔬菜，实例数量超过81.9万，其中约52万实例处于遮挡状态，平均遮挡率达到30.6%，显著高于现有模态数据集。数据集的标注体系极为丰富，不仅提供可见、不可见及模态掩码，还包含实例的完整外观图像、层次顺序与遮挡关系双序标注，支持模态形状感知、外观补全及顺序推理等多类任务。此外，数据集通过合成方法生成，避免了人工标注的主观性与误差，确保了标注的精确性，同时其大规模与多样性为模型训练提供了可靠基础。

使用方法

Intra-AFruit数据集适用于模态实例分割及其相关任务的模型训练与评估。研究人员可利用其提供的多类掩码标注进行模态形状预测模型的监督学习，或借助完整外观图像开展模态外观补全研究。数据集的层次顺序与遮挡关系标注可用于物体顺序感知任务的算法开发。在具体使用中，数据集已划分为训练集（21万图像）与测试集（4.5万图像），确保训练与测试实例类别无重叠，以评估模型泛化能力。此外，数据集支持弱监督学习，例如基于点的监督方案，仅需每个实例的10个随机点标注即可训练模型，显著降低标注成本。通过结合层先验与级联策略，该数据集为处理同类遮挡场景提供了有效的基准平台。

背景与挑战

背景概述

在计算机视觉领域，感知被遮挡物体的完整形态——即非模态感知——是模拟人类视觉系统、实现场景深度理解的关键能力。Intra-AFruit数据集由墨尔本大学和莫纳什大学的研究团队于2023年提出，专注于解决密集同类物体遮挡场景下的非模态实例分割问题。该数据集包含超过25万张合成图像，涵盖水果和蔬菜等10个类别，提供了包括可见掩码、不可见掩码、非模态掩码、完整外观及层级顺序在内的多类型标注。作为当前规模最大、标注最丰富的非模态数据集之一，Intra-AFruit填补了同类遮挡研究的数据空白，为机器人抓取、自动化农业等下游任务提供了重要的基准支持。

当前挑战

Intra-AFruit数据集致力于应对非模态实例分割中同类物体密集遮挡的挑战。由于同类物体在特征上高度相似，遮挡边界难以区分，模型易产生掩码冲突与识别错误。在构建过程中，研究团队面临合成数据与真实场景间的领域鸿沟问题，需通过精细化合成流程确保标注的准确性与多样性。此外，为支撑弱监督学习，数据集创新性地引入了基于点的标注方案，以降低全掩码标注的高成本与主观偏差，但这也对模型在有限监督下理解复杂遮挡关系提出了更高要求。

常用场景

经典使用场景

在计算机视觉领域，处理密集同类物体遮挡场景一直是模态感知任务中的核心挑战。Intra-AFruit数据集通过合成超过26.7万张图像，专门针对水果和蔬菜类别的密集同类遮挡情境，提供了包括模态掩码、不可见掩码、完整外观及层级顺序在内的多类型标注。该数据集最经典的应用场景在于推动模态实例分割研究，特别是在训练和评估模型处理同类物体重叠时的完整形状推断能力，为算法在复杂遮挡环境下的鲁棒性提供了标准化测试平台。

解决学术问题

该数据集有效解决了模态感知研究中因缺乏大规模、精细化标注数据而难以显式建模同类遮挡的学术难题。通过提供精确的合成标注，它支持模态实例分割、遮挡顺序感知以及外观补全等多项任务，显著降低了因人工标注主观性带来的偏差。其引入的层级先验概念，使模型能够区分重叠实例的不同层级，从而缓解了传统非极大值抑制在密集同类遮挡场景中的失效问题，推动了弱监督学习方法在模态任务中的进展。

衍生相关工作

基于Intra-AFruit数据集，研究者提出了多种创新方法，其中最具代表性的是结合层级先验与点监督的模态实例分割框架PLIn。该工作首次将点监督引入模态任务，通过层级解耦策略优化了同类遮挡下的实例检测与分割性能。此外，数据集还催生了针对模态外观补全、多层顺序感知等延伸方向的研究，例如利用完整外观标注进行纹理推断，或结合遮挡顺序关系开发更精细的场景理解模型。这些衍生工作共同推动了模态感知领域向更高效、更弱监督化的方向发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集