five

MaSS13K|图像分割数据集|计算机视觉数据集

收藏
github2025-04-08 更新2025-04-09 收录
图像分割
计算机视觉
下载链接:
https://github.com/xiechenxi99/MaSS13K
下载链接
链接失效反馈
资源简介:
MaSS13K是一个用于抠图级别语义分割的基准数据集。
创建时间:
2025-03-18
原始信息汇总

MaSS13K 数据集概述

基本信息

  • 数据集名称: MaSS13K: A Matting-level Semantic Segmentation Benchmark
  • 发布机构: The Hong Kong Polytechnic University, OPPO Research Institute
  • 相关论文: Paper-Arxiv
  • 会议: CVPR2025
  • 许可证: Apache 2.0 license

数据集内容

  • 描述: MaSS13K 是一个 Matting-level 的语义分割基准数据集。
  • 数据可用性: 通过 GoogleDrive 提供下载。

基准测试

  • 定性比较: 包含 MaSSFormer 与其他三种基线方法的视觉比较。
  • 定量比较: 在 MaSS13K 验证集和测试集上的定量评估。

框架

  • MaSSFormer: 包含图像编码器、像素解码器和变换器解码器的模型架构。

引用

bash @InProceedings{Xie2025mass13k, author = {Chenxi Xie, Minghan Li, Hui Zeng, Jun Luo and Zhang, Lei}, title = {MaSS13K: A Matting-level Semantic Segmentation Benchmark}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year = {2025} }

联系方式

  • 邮箱: chenxi.xie@connect.polyu.hk
AI搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,高质量的数据集对于推动图像分割技术的发展至关重要。MaSS13K数据集通过精心设计的采集与标注流程构建而成,研究团队从多样化场景中筛选了13,000张具有复杂背景的高分辨率图像,每张图像均经过专业标注团队进行像素级语义分割和matting-level精细化标注。数据采集过程严格遵循多阶段质量验证机制,包括初始标注、交叉校验和专家复核,确保标注边界达到亚像素级精度。
使用方法
研究者可通过GoogleDrive获取该数据集的完整资源包,压缩包内按标准目录结构组织训练集、验证集和测试集。使用前需解压并阅读附带的标注规范文档,其中详细说明了PNG格式的标签编码规则。评估时应严格遵循官方提供的分割协议,使用标准mIoU和边界准确率(BA)双指标体系。配套的MaSSFormer框架代码即将开源,届时可实现从数据加载到模型训练的全流程支持。
背景与挑战
背景概述
MaSS13K数据集由香港理工大学和OPPO研究院联合研发,于2025年正式发布,并收录于计算机视觉顶级会议CVPR。该数据集聚焦于图像处理领域中的抠图级语义分割任务,旨在为细粒度物体边缘识别提供高精度标注基准。研究团队通过构建包含13,000张高质量标注样本的数据库,解决了传统语义分割在透明、半透明物体及复杂边缘处理中的性能瓶颈,推动了医疗影像、自动驾驶等场景的算法进步。
当前挑战
该数据集针对抠图级语义分割中透明物体边缘模糊、多层级透明度过渡等难题,要求算法同时实现像素级分类与透明度预测。数据构建过程中面临标注一致性控制的挑战,需平衡人工标注效率与亚像素级精度需求。此外,动态光影条件下的透明材质反射干扰,以及数据规模与标注成本间的矛盾,均为该基准的核心技术壁垒。
常用场景
经典使用场景
在计算机视觉领域,精确的语义分割与图像抠图技术一直是研究热点。MaSS13K数据集作为一个结合抠图级别精度的语义分割基准,为研究者提供了高质量的标注数据。该数据集最经典的使用场景是评估和比较不同语义分割算法在精细边缘处理上的性能,尤其是在需要高精度分割的应用中,如医学图像分析、自动驾驶场景理解等。
解决学术问题
MaSS13K数据集解决了传统语义分割任务中边缘模糊和细节丢失的学术难题。通过提供抠图级别的标注,该数据集使得研究者能够开发出更精细的分割模型,从而在学术上推动了语义分割与图像抠图技术的融合。其意义在于为高精度分割任务设立了新的基准,影响了后续相关研究的方向和方法。
实际应用
在实际应用中,MaSS13K数据集的高精度标注使其特别适合需要精细分割的场景。例如,在影视后期制作中,精确的物体分割可以显著提升特效合成的质量;在电子商务中,高质量的产品图像分割能够提升用户体验。这些应用场景均受益于该数据集提供的精细标注和评估标准。
数据集最近研究
最新研究方向
在计算机视觉领域,精细化的语义分割技术正逐渐成为研究热点,MaSS13K数据集的推出为这一方向注入了新的活力。该数据集以其独特的Matting-level标注标准,为高精度语义分割任务提供了强有力的基准支持。近期研究表明,结合Transformer架构的MaSSFormer模型在该数据集上展现出卓越性能,尤其在边缘细节处理和复杂场景理解方面具有显著优势。随着多模态学习和自监督预训练技术的快速发展,MaSS13K正在推动语义分割向像素级精度的新高度迈进,为图像编辑、增强现实等应用场景提供了更可靠的技术支撑。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Global Volcano Database

全球火山数据库包含有关全球火山的信息,包括火山的位置、类型、历史喷发记录、海拔高度等详细数据。该数据集旨在为地质学家、环境科学家和应急管理机构提供有关火山活动的全面信息。

volcano.si.edu 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录