Carve/carveset
收藏Hugging Face2023-09-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Carve/carveset
下载链接
链接失效反馈官方服务:
资源简介:
CarveSet V2.0数据集是一个广泛的数据集,涵盖了9个常见对象类别,主要用于背景移除和显著对象检测任务。数据集包含16,497张图像,分为训练集(12,497对图像)、验证集(2,000对图像)和测试集(2,000对图像)。图像来源包括Pexels、Unsplash和SOPG数据集,图像质量高,分辨率大约为2500x2500或2048x1536像素。文件结构包括图像、掩码和三重映射等数据,并提供了详细的许可证信息。
CarveSet V2.0 is a comprehensive dataset covering 9 common object categories, primarily intended for background removal and salient object detection tasks. The dataset includes 16,497 images, split into three subsets: training set (12,497 image pairs), validation set (2,000 image pairs), and test set (2,000 image pairs). The images are sourced from Pexels, Unsplash, and the SOPG dataset, featuring high quality with resolutions of approximately 2500×2500 or 2048×1536 pixels. Its file structure contains data modalities such as images, masks, and triplet mappings, alongside detailed license information.
提供机构:
Carve
原始信息汇总
数据集 CarveSet V2.0 概述
基本信息
- 名称: CarveSet
- 任务类别: 图像分割
- 标签: 计算机视觉, 背景移除, SOD, 显著对象检测, 分割, 图像分割
- 数据集大小: 10K<n<100K
- 总图像数量: 16,497
数据集组成
类别分布
| 类别对象 | 图像数量 |
|---|---|
| 汽车 | 1,878 |
| 服装 | 1,840 |
| 家居用品 | 1,878 |
| 电子产品 | 1,806 |
| 儿童玩具 | 1,785 |
| 厨房用品 | 1,878 |
| 人物 | 1,777 |
| 室内物品 | 1,777 |
| 动物 | 1,878 |
数据划分
- 测试集: 2,000 对图像
- 验证集: 2,000 对图像
- 训练集: 12,497 对图像
图像来源
- CarveSet: 包含 3,172 张高质量图像,尺寸约为 2500x2500 像素,手动从 Pexels 和 Unsplash 收集。
- SOPG: 包含 13,325 张图像,尺寸约为 2048x1536 像素,从 SOPG 数据集放大 4 倍。
文件结构
carveset2- 图像库carveset2/train- 训练集carveset2/train/images- RGB 图像carveset2/train/masks- 掩码carveset2/train/trimaps- 三维图
carveset2/val- 验证集carveset2/val/images- RGB 图像carveset2/val/masks- 掩码carveset2/val/trimaps- 三维图
carveset2/test- 测试集carveset2/test/images- RGB 图像carveset2/test/masks- 掩码carveset2/test/trimaps- 三维图
carveset2/train.csv- 训练集图像路径和许可证表carveset2/val.csv- 验证集图像路径和许可证表carveset2/test.csv- 测试集图像路径和许可证表licenses/*.txt- 许可证文本terms_of_use.pdf- 使用条款
许可证
- RGB 图像
- Pexels License - 表格中的
pexels - Unsplash License - 表格中的
unsplash - SOPG MIT License - 表格中的
mit
- Pexels License - 表格中的
- 标注 - Apache License 2.0
详细许可证信息请参阅 terms_of_use.pdf。
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,高质量图像分割数据集的构建是推动算法发展的基石。CarveSet V2.0数据集通过整合两个主要来源精心构建而成:其一是从Pexels和Unsplash等专业图库中手动精选的3,172张高分辨率图像,构成CarveSet核心部分;其二是对现有SOPG数据集中的13,325张图像进行四倍上采样扩充。整个数据集共计16,497张图像,并依据九大常见对象类别进行系统化组织,涵盖了从交通工具到日常用品的广泛语义范畴。所有图像均配备了精确的像素级掩码和三分图标注,并按照训练、验证与测试的标准流程进行了划分,确保了数据分布的均衡性与评估的严谨性。
特点
该数据集在显著对象检测与背景移除任务中展现出鲜明的专业特性。其核心优势在于覆盖了九个高度细化的对象类别,包括汽车、服装、家居物品、电子产品等,这种多类别的设计为模型提供了丰富的语义上下文学习机会。数据集提供了三种关键的标注形式:原始RGB图像、精确的二值分割掩码以及用于指示前景、背景和过渡区域的三分图,这为训练不同复杂度的分割模型提供了极大的灵活性。此外,数据来源兼具高质量的手工采集图像与经过上采样的扩充图像,在保证视觉保真度的同时,也有效增加了数据的规模和多样性。
使用方法
为便于研究者进行模型开发与评估,数据集已预置了标准化的文件结构。用户可直接下载`carveset2.zip`压缩包,解压后可见按`train`、`val`、`test`划分的独立目录。每个目录下均包含`images`、`masks`和`trimaps`子文件夹,分别存放原始图像、分割掩码和三分图,形成一一对应的配对关系。配套的CSV文件则记录了图像路径及其对应的开源许可证信息,如Pexels、Unsplash或MIT许可证,确保了使用的合规性。研究人员可依据此结构直接加载数据,用于训练、验证图像分割或背景移除模型,并通过对比掩码预测结果进行定量性能评估。
背景与挑战
背景概述
在计算机视觉领域,图像分割与背景移除技术是图像处理与编辑的核心任务,对于电子商务、增强现实及多媒体内容创作具有重要应用价值。CarveSet数据集由Carve团队构建,其V2.0版本整合了高质量图像资源,涵盖汽车、服装、家居物品、电子产品、儿童玩具、厨房用具、人物、室内场景及动物等九大常见对象类别,总计包含16,497对图像与掩码数据。该数据集旨在为显著性对象检测与图像分割模型提供大规模、多样化的训练与评估基准,推动自动化背景移除技术的发展,并促进相关算法在真实场景中的泛化能力提升。
当前挑战
CarveSet数据集致力于解决图像背景移除这一复杂视觉任务的挑战,其核心难点在于处理对象边缘的精细分割,尤其是在复杂背景、透明或半透明物体、以及细长结构(如毛发)等场景下保持高精度。在构建过程中,数据集面临多重挑战:一是数据收集与标注的规模与质量平衡,需从Pexels、Unsplash等开源平台手动筛选高分辨率图像,并生成精确的掩码与三值图;二是类别分布的均衡性维护,确保九大对象类别在训练、验证与测试集中具有代表性;三是多源数据(如SOPG数据集)的整合与格式统一,要求在不同图像尺寸与许可协议下保持数据一致性,同时遵循严格的版权与使用条款。
常用场景
经典使用场景
在计算机视觉领域,背景移除与图像分割任务常面临数据稀缺的挑战。CarveSet数据集以其涵盖九大常见对象类别的丰富图像资源,成为训练和评估显著性物体检测与图像分割模型的经典基准。该数据集通过提供高分辨率原始图像、精确掩码及三值图,为算法在复杂场景下的前景-背景分离性能提供了标准化测试平台,尤其适用于提升模型在多样化真实世界对象上的泛化能力。
解决学术问题
该数据集有效应对了学术研究中背景移除任务缺乏大规模、高质量标注数据的困境。通过整合手工采集与扩增图像,CarveSet为显著性物体检测、语义分割及实例分割等方向提供了结构化的评估框架。其意义在于推动了精细分割技术的发展,促进了模型在跨类别对象识别中的鲁棒性研究,并为弱监督与半监督学习方法的创新提供了数据支撑,从而深化了计算机视觉领域对物体边界精确建模的理论探索。
衍生相关工作
围绕CarveSet数据集,已衍生出一系列聚焦于高效背景移除与精细分割的经典研究工作。这些工作不仅探索了基于深度学习的端到端分割架构优化,还推动了针对复杂边缘与透明物体处理的算法创新。部分研究进一步利用该数据集的多元类别特性,开展了跨域自适应与少样本学习方法的实验,为图像分割技术的演进提供了重要的实证基础与性能参照。
以上内容由遇见数据集搜集并总结生成



