coco-human-inpainted-objects

Hugging Face2024-11-07 更新2024-12-12 收录

图像处理

对象识别

数据链接：

https://huggingface.co/datasets/Rapidata/coco-human-inpainted-objects 数据链接链接失效反馈

官方服务：

资源简介：

该数据集是从https://www.rapidata.ai平台收集的，包含数十万个人工标注的70多种不同类别的对象。数据集包含约2000张来自COCO数据集的图像，用户在这些图像上使用画笔工具绘制特定类别的对象。每张图像上只有一个目标对象，因此任务不模糊。用户交互的结果是用户在特定图像上绘制的线条集合。数据集的挑战在于将每张图像上的线条聚合起来，以了解目标对象的位置。每张图像提供了数百条由不同人绘制的2D线条，可用于创建目标对象的边界框和分割图。除了线条，数据集还包含COCO 2D边界框的地面真值以及基准预测。数据集的元数据文件描述了每张图像的详细信息，包括COCO文件名、类别名称、基准预测、地面真值、IoU分数以及用户绘制的线条的3D坐标数组。

This dataset is collected from the platform at https://www.rapidata.ai. It contains hundreds of thousands of manually annotated objects belonging to over 70 distinct categories. The dataset includes approximately 2,000 images sourced from the COCO dataset, on which users draw objects of specific categories using brush tools. There is exactly one target object per image, making the task unambiguous. The outcome of user interaction is a collection of lines drawn by users on the corresponding image. The core challenge of this dataset lies in aggregating the lines on each image to determine the location of the target object. Hundreds of 2D lines drawn by different users are provided for each image, which can be used to generate bounding boxes and segmentation masks for the target object. In addition to the lines, the dataset also includes the ground truth 2D bounding boxes from COCO as well as baseline predictions. The dataset's metadata file details each image, including the COCO filename, category name, baseline predictions, ground truth, IoU scores, and the 3D coordinate array of the user-drawn lines.

创建时间：

2024-11-07

原始信息汇总

数据集概述

数据集信息

特征:
- image: 图像数据，数据类型为图像。
- coco_filename: 图像在COCO数据集中的唯一标识符，数据类型为字符串。
- class_name: 用户被要求在图像上标记的类别/类别名称，与COCO中的category_name相同，数据类型为字符串。
- prediction: 基于热图的COCO边界框基线预测，数据类型为字符串。
- ground_truth: COCO边界框的地面真值，数据类型为字符串。
- IoU: 基线预测与地面真值之间的交并比（IoU）得分，数据类型为浮点数。
- lines: 坐标的三维数组，数据类型为字符串。每个用户可以绘制多条线，第一个维度表示不同的用户，第二个维度表示每个用户绘制的多条线，第三个维度表示每条线的[x, y]坐标，相对于图像尺寸。
分割:
- train: 训练集，包含1631个样本，大小为393005272.944字节。
- validation: 验证集，包含332个样本，大小为81827046.0字节。
下载大小: 391573463字节
数据集大小: 474832318.944字节

数据集结构

配置:
- default:
  - train: 数据路径为data/train-*。
  - validation: 数据路径为data/validation-*。

数据集描述

来源: 数据集在https://www.rapidata.ai平台上收集，包含70多种不同类型对象的数万个手动标注。
任务: 用户在图像上使用画笔工具绘制特定类别的对象，每个图像上只有一个此类对象，任务明确。
挑战: 数据集的挑战在于将每张图像上的线条聚合，以了解目标对象的位置。每张图像提供数百条由不同人类绘制的2D线条，可用于创建目标对象的边界框和分割图。
元数据: metadata.csv文件描述了每张图像的信息，包含以下列：
- coco_filename: 图像在COCO数据集中的唯一标识符。
- class_name: 用户被要求在图像上标记的类别/类别名称。
- prediction: 基于热图的COCO边界框基线预测。
- ground_truth: COCO边界框的地面真值。
- IoU: 基线预测与地面真值之间的交并比（IoU）得分。
- lines: 坐标的三维数组，表示不同用户绘制的线条及其坐标。

搜集汇总

数据集介绍

构建方式

该数据集构建于Rapidata.ai平台，通过人工标注的方式对COCO数据集中的图像进行对象标记。用户被展示一张图像，并利用画笔工具对图像中的单一对象进行自由绘制，确保任务无歧义。最终，数据集收集了数千条由不同用户绘制的二维线条，这些线条用于生成目标对象的边界框和分割图。

特点

数据集包含超过70种不同类别的对象，涵盖了约2000张COCO数据集图像。每条记录均包含用户绘制的线条、COCO二维边界框的真实标注以及基线预测结果。特别地，线条数据以三维数组形式存储，第一维度代表不同用户，第二维度代表每个用户绘制的多条线条，第三维度则代表每条线条的坐标点。

使用方法

该数据集适用于图像分割和掩码生成任务。用户可通过分析每条记录中的线条数据，结合COCO的真实标注和基线预测，生成目标对象的边界框和分割图。数据集还提供了IoU（交并比）评分，便于评估预测结果与真实标注的匹配程度。通过这种方式，研究人员可以探索人类标注的多样性，并改进目标检测和分割算法。

背景与挑战

背景概述

coco-human-inpainted-objects数据集由Rapidata平台于近年创建，旨在通过人工标注的方式对COCO数据集中的图像进行精细化处理。该数据集包含了超过70种不同类别物体的数万条人工标注，主要研究人员通过让用户在图像上自由绘制线条来标记特定物体，从而生成丰富的标注数据。这一数据集的核心研究问题在于如何通过人工绘制的线条来精确地定位和分割图像中的目标物体，为图像分割和掩码生成任务提供了新的研究视角。该数据集的发布不仅丰富了COCO数据集的应用场景，还为计算机视觉领域的研究者提供了宝贵的实验数据，推动了图像分割技术的发展。

当前挑战

coco-human-inpainted-objects数据集面临的主要挑战在于如何有效地聚合不同用户在图像上绘制的线条，以生成精确的目标物体定位和分割结果。由于每个用户绘制的线条可能存在较大差异，如何从这些多样化的标注中提取出一致且准确的物体边界信息成为关键问题。此外，数据集构建过程中，如何确保标注的准确性和一致性也面临挑战，尤其是在处理复杂场景和多类别物体时。尽管数据集提供了COCO的基准预测和真实标注，但如何利用这些数据进一步提升模型性能，尤其是在处理用户绘制的多样化线条时，仍然是研究者需要解决的重要问题。

常用场景

经典使用场景

在计算机视觉领域，coco-human-inpainted-objects数据集被广泛应用于图像分割和掩码生成任务。该数据集通过收集大量人类标注的线条数据，为研究者提供了一个独特的视角，用于分析和理解人类在图像标注过程中的行为模式。这些线条数据可以进一步用于生成精确的目标对象边界框和分割图，从而提升图像分割算法的性能。

衍生相关工作

coco-human-inpainted-objects数据集催生了一系列经典的研究工作，特别是在图像分割和掩码生成领域。基于该数据集，研究者提出了多种创新的算法，如基于人类标注线条的分割模型优化方法，以及利用IoU评分进行模型性能评估的新框架。这些工作不仅推动了图像分割技术的发展，也为后续研究提供了宝贵的参考和借鉴。

数据集最近研究