shunk031/cocostuff

Name: shunk031/cocostuff
Creator: shunk031
Published: 2022-12-09 04:29:27
License: 暂无描述

Hugging Face2022-12-09 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/shunk031/cocostuff

下载链接

链接失效反馈

官方服务：

资源简介：

COCO-Stuff是现有最大的带有密集stuff和thing注释的数据集。它扩展了COCO 2017数据集的所有164K图像，并为91个stuff类别提供了像素级注释。该数据集通过超像素注释协议高效地利用了原始thing注释，并分析了stuff和thing类别的重要性、它们之间的空间关系以及现代语义分割方法在stuff和thing类别上的表现。

提供机构：

shunk031

原始信息汇总

数据集概述

数据集名称

COCO-Stuff

数据集描述

数据集总结

COCO-Stuff 是当前最大的包含密集 stuff 和 thing 注释的数据集。该数据集通过引入基于超像素的高效注释协议，为 COCO 2017 数据集中的所有 164K 图像添加了 91 个 stuff 类的像素级注释。此数据集不仅分析了 stuff 和 thing 类的重要性，还探讨了它们之间的空间关系，以及现代语义分割方法在 stuff 和 thing 类上的表现。

支持的任务和评估指标

任务：对象检测
评估指标：准确率（accuracy）、交并比（iou）

数据集结构

数据实例

数据集包含两种配置：stuff-thing 和 stuff-only。

stuff-thing 示例：包含图像、图像文件名、图像ID、宽度、高度、对象列表和 stuff 映射。
stuff-only 示例：包含图像、图像文件名、图像ID、宽度、高度和对象列表。

数据字段

image: 图像对象
image_id: 图像唯一ID
image_filename: 图像文件名
width: 图像宽度
height: 图像高度
objects: 对象列表，每个对象包含 object_id, x, y, w, h, name 字段
stuff_map: 包含 Stuff + thing 注释的图像对象（仅在 stuff-thing 配置中）

数据分割

stuff-thing: 训练集 118,280 个样本，验证集 5,000 个样本
stuff-only: 训练集 118,280 个样本，验证集 5,000 个样本

数据集创建

注释

COCO-Stuff 包含 172 个类：80 个 thing 类，91 个 stuff 类，以及 1 个未标记类。91 个 stuff 类由专家注释者精心标注。

许可证信息

COCO 图像：Flickr 使用条款
COCO 注释：Creative Commons Attribution 4.0 License
COCO-Stuff 注释 & 代码：Creative Commons Attribution 4.0 License

引用信息

bibtex @INPROCEEDINGS{caesar2018cvpr, title={COCO-Stuff: Thing and stuff classes in context}, author={Caesar, Holger and Uijlings, Jasper and Ferrari, Vittorio}, booktitle={Computer vision and pattern recognition (CVPR), 2018 IEEE conference on}, organization={IEEE}, year={2018} }

搜集汇总

数据集介绍

构建方式

COCO-Stuff数据集的构建，是在COCO 2017数据集的基础上，增添了针对91个stuff类别的像素级注释。构建过程中，采用了一种高效的基于超像素的标注协议，该协议利用了原有的thing类别注释，实现了标注速度与质量的权衡，并对标注时间与边界复杂性之间的关系进行了探讨。

使用方法

使用COCO-Stuff数据集时，用户需要根据特定配置加载相应的版本后缀。数据集支持两种配置：'stuff-thing'和'stuff-only'。通过加载这些配置，用户可以获取包含图像及其注释的Python字典，其中注释包括图像ID、宽度、高度、对象列表以及stuff地图等字段。

背景与挑战

背景概述

COCO-Stuff数据集，作为计算机视觉领域的重要资源，由Holger Caesar、Jasper Uijlings和Vittorio Ferrari等研究人员于2018年提出，旨在通过为COCO 2017数据集中的164K图像添加像素级注释，以丰富对场景的理解。该数据集定义了172个类别，包括80个thing类别和91个stuff类别，填补了以往研究中对stuff类别关注不足的空白。COCO-Stuff不仅提供了对物体（thing）的注释，还首次大规模地引入了对背景区域（stuff）的详细注释，从而对图像的场景类型、物体位置、物理属性等方面提供了深入的理解。该数据集的创建，对于推动计算机视觉领域的发展，尤其是对场景理解的研究，具有显著影响。

当前挑战

COCO-Stuff数据集的构建过程中，研究人员面临了多个挑战。首先，如何高效地对大规模图像进行像素级的stuff类别注释，确保注释质量和速度的平衡，是一个关键问题。其次，数据集中thing与stuff之间的空间关系复杂，这要求注释协议能够准确捕捉这些关系。此外，数据集的多样性和规模给数据预处理、存储和使用带来了挑战。在研究领域，如何有效利用COCO-Stuff进行场景理解、物体检测和语义分割等任务的算法开发，以及如何处理数据集中可能存在的偏差和局限性，是当前的研究热点和挑战。

常用场景

经典使用场景

在计算机视觉研究领域，COCO-Stuff数据集以其丰富的场景内容与细致的标注，成为语义分割任务的重要资源。该数据集通过提供91种stuﬀ类别（如草地、天空等无固定形状的背景区域）与80种thing类别（如车辆、人物等具有明确形状的对象）的像素级标注，支持研究者在图像理解、场景分类及上下文关系分析等方面开展深入探索。

解决学术问题

COCO-Stuff数据集解决了传统计算机视觉研究中对stuﬀ类别重视不足的问题，为研究者提供了丰富的标注数据，有助于分析stuﬀ与thing类别之间的空间关系，以及它们在图像中的表面覆盖与提及频率，从而推动了对图像场景深层语义理解的学术研究。

实际应用

在实际应用中，COCO-Stuff数据集可用于提升自动驾驶系统中的环境理解能力，改善图像识别算法在复杂场景下的表现，同时也为图像编辑与增强技术提供了支持，使得计算机视觉技术在现实世界的应用更加广泛和深入。

数据集最近研究