shunk031/cocostuff
收藏Hugging Face2022-12-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shunk031/cocostuff
下载链接
链接失效反馈官方服务:
资源简介:
COCO-Stuff是现有最大的带有密集stuff和thing注释的数据集。它扩展了COCO 2017数据集的所有164K图像,并为91个stuff类别提供了像素级注释。该数据集通过超像素注释协议高效地利用了原始thing注释,并分析了stuff和thing类别的重要性、它们之间的空间关系以及现代语义分割方法在stuff和thing类别上的表现。
COCO-Stuff是现有最大的带有密集stuff和thing注释的数据集。它扩展了COCO 2017数据集的所有164K图像,并为91个stuff类别提供了像素级注释。该数据集通过超像素注释协议高效地利用了原始thing注释,并分析了stuff和thing类别的重要性、它们之间的空间关系以及现代语义分割方法在stuff和thing类别上的表现。
提供机构:
shunk031
原始信息汇总
数据集概述
数据集名称
COCO-Stuff
数据集描述
数据集总结
COCO-Stuff 是当前最大的包含密集 stuff 和 thing 注释的数据集。该数据集通过引入基于超像素的高效注释协议,为 COCO 2017 数据集中的所有 164K 图像添加了 91 个 stuff 类的像素级注释。此数据集不仅分析了 stuff 和 thing 类的重要性,还探讨了它们之间的空间关系,以及现代语义分割方法在 stuff 和 thing 类上的表现。
支持的任务和评估指标
- 任务:对象检测
- 评估指标:准确率(accuracy)、交并比(iou)
数据集结构
数据实例
数据集包含两种配置:stuff-thing 和 stuff-only。
stuff-thing示例:包含图像、图像文件名、图像ID、宽度、高度、对象列表和 stuff 映射。stuff-only示例:包含图像、图像文件名、图像ID、宽度、高度和对象列表。
数据字段
image: 图像对象image_id: 图像唯一IDimage_filename: 图像文件名width: 图像宽度height: 图像高度objects: 对象列表,每个对象包含object_id,x,y,w,h,name字段stuff_map: 包含 Stuff + thing 注释的图像对象(仅在stuff-thing配置中)
数据分割
stuff-thing: 训练集 118,280 个样本,验证集 5,000 个样本stuff-only: 训练集 118,280 个样本,验证集 5,000 个样本
数据集创建
注释
COCO-Stuff 包含 172 个类:80 个 thing 类,91 个 stuff 类,以及 1 个未标记类。91 个 stuff 类由专家注释者精心标注。
许可证信息
- COCO 图像:Flickr 使用条款
- COCO 注释:Creative Commons Attribution 4.0 License
- COCO-Stuff 注释 & 代码:Creative Commons Attribution 4.0 License
引用信息
bibtex @INPROCEEDINGS{caesar2018cvpr, title={COCO-Stuff: Thing and stuff classes in context}, author={Caesar, Holger and Uijlings, Jasper and Ferrari, Vittorio}, booktitle={Computer vision and pattern recognition (CVPR), 2018 IEEE conference on}, organization={IEEE}, year={2018} }
搜集汇总
数据集介绍

构建方式
COCO-Stuff数据集的构建,是在COCO 2017数据集的基础上,增添了针对91个stuff类别的像素级注释。构建过程中,采用了一种高效的基于超像素的标注协议,该协议利用了原有的thing类别注释,实现了标注速度与质量的权衡,并对标注时间与边界复杂性之间的关系进行了探讨。
使用方法
使用COCO-Stuff数据集时,用户需要根据特定配置加载相应的版本后缀。数据集支持两种配置:'stuff-thing'和'stuff-only'。通过加载这些配置,用户可以获取包含图像及其注释的Python字典,其中注释包括图像ID、宽度、高度、对象列表以及stuff地图等字段。
背景与挑战
背景概述
COCO-Stuff数据集,作为计算机视觉领域的重要资源,由Holger Caesar、Jasper Uijlings和Vittorio Ferrari等研究人员于2018年提出,旨在通过为COCO 2017数据集中的164K图像添加像素级注释,以丰富对场景的理解。该数据集定义了172个类别,包括80个thing类别和91个stuff类别,填补了以往研究中对stuff类别关注不足的空白。COCO-Stuff不仅提供了对物体(thing)的注释,还首次大规模地引入了对背景区域(stuff)的详细注释,从而对图像的场景类型、物体位置、物理属性等方面提供了深入的理解。该数据集的创建,对于推动计算机视觉领域的发展,尤其是对场景理解的研究,具有显著影响。
当前挑战
COCO-Stuff数据集的构建过程中,研究人员面临了多个挑战。首先,如何高效地对大规模图像进行像素级的stuff类别注释,确保注释质量和速度的平衡,是一个关键问题。其次,数据集中thing与stuff之间的空间关系复杂,这要求注释协议能够准确捕捉这些关系。此外,数据集的多样性和规模给数据预处理、存储和使用带来了挑战。在研究领域,如何有效利用COCO-Stuff进行场景理解、物体检测和语义分割等任务的算法开发,以及如何处理数据集中可能存在的偏差和局限性,是当前的研究热点和挑战。
常用场景
经典使用场景
在计算机视觉研究领域,COCO-Stuff数据集以其丰富的场景内容与细致的标注,成为语义分割任务的重要资源。该数据集通过提供91种stuff类别(如草地、天空等无固定形状的背景区域)与80种thing类别(如车辆、人物等具有明确形状的对象)的像素级标注,支持研究者在图像理解、场景分类及上下文关系分析等方面开展深入探索。
解决学术问题
COCO-Stuff数据集解决了传统计算机视觉研究中对stuff类别重视不足的问题,为研究者提供了丰富的标注数据,有助于分析stuff与thing类别之间的空间关系,以及它们在图像中的表面覆盖与提及频率,从而推动了对图像场景深层语义理解的学术研究。
实际应用
在实际应用中,COCO-Stuff数据集可用于提升自动驾驶系统中的环境理解能力,改善图像识别算法在复杂场景下的表现,同时也为图像编辑与增强技术提供了支持,使得计算机视觉技术在现实世界的应用更加广泛和深入。
数据集最近研究
最新研究方向
COCO-Stuff数据集作为计算机视觉领域的重要资源,其最新研究方向主要集中在像素级语义分割、物体检测以及场景理解等方面。研究者们利用该数据集对事物与背景区域进行细致的标注,探索事物与背景之间的空间关系,以及如何通过背景信息来提升物体检测的准确性。近期研究不仅关注于提高标注效率和准确性,还致力于分析不同类别在图像中的表面覆盖率及其在图像描述中的提及频率,从而深入理解场景类型和物体类别之间的关系。此外,COCO-Stuff在评估现代语义分割方法性能方面也具有重要意义,其研究成果对于智能视觉系统的开发和优化具有深远影响。
以上内容由遇见数据集搜集并总结生成



