RevealLayer-100K

Hugging Face2026-05-18 更新2026-05-21 收录

下载链接：

https://huggingface.co/datasets/qihoo360/RevealLayer-100K

下载链接

链接失效反馈

官方服务：

资源简介：

RevealLayer Open数据集是一个用于图像分层分解的开源数据集，源自ICML 2026论文《RevealLayer: Disentangling Hidden and Visible Layers via Occlusion-Aware Image Decomposition》。该数据集旨在支持基于边界框引导的自然图像分解任务，即给定一张RGB图像和实例边界框，将场景分解为干净的背景层和对象级的前景层（每个前景层以RGBA格式表示）。数据集规模在10万到100万样本之间。数据内容包含两个主要部分：1) 训练集和完全标注的基准子集（RevealLayerBenchMark-200），提供原始图像、背景图像真值、前景RGBA层真值以及边界框标注；2) 野外基准子集（RevealLayerBenchMark-wild），仅包含原始图像和边界框标注，用于定性评估和真实世界鲁棒性测试，不提供背景或前景层真值。每个样本的元数据通过JSON文件组织，包含唯一标识符、图像路径、背景路径、前景层路径列表和边界框列表等字段。该数据集适用于图像分解、分层图像编辑、对象移除、图像抠图、图像修复等计算机视觉任务。需要注意的是，数据集不包含第三方基准（如AIM-500、RefMatte_RW100、OBER-Test/ObjectClear）的图像和真值，用户需从官方来源获取并遵守相应许可。

The RevealLayer Open dataset is an open-source dataset for image layer decomposition, originating from the ICML 2026 paper RevealLayer: Disentangling Hidden and Visible Layers via Occlusion-Aware Image Decomposition. It aims to support bounding box-guided natural image decomposition tasks, where given an RGB image and instance bounding boxes, scenes are decomposed into a clean background layer and object-level foreground layers (each represented in RGBA format). The dataset size ranges from 100,000 to 1,000,000 samples. It consists of two main parts: 1) a training set and a fully annotated benchmark subset (RevealLayerBenchMark-200), providing original images, background ground truth, foreground RGBA layer ground truth, and bounding box annotations; 2) a wild benchmark subset (RevealLayerBenchMark-wild), containing only original images and bounding box annotations for qualitative evaluation and real-world robustness testing, without background or foreground layer ground truth. Metadata for each sample is organized via JSON files, including fields such as unique identifiers, image paths, background paths, lists of foreground layer paths, and bounding box lists. The dataset is suitable for computer vision tasks like image decomposition, layered image editing, object removal, image matting, and image inpainting. Note that the dataset does not include images and ground truth from third-party benchmarks (e.g., AIM-500, RefMatte_RW100, OBER-Test/ObjectClear), and users must obtain them from official sources and comply with respective licenses.

创建时间：

2026-05-13

搜集汇总

数据集介绍

构建方式

RevealLayer-100K数据集源于ICML 2026收录的论文《RevealLayer: Disentangling Hidden and Visible Layers via Occlusion-Aware Image Decomposition》，旨在解决基于边界框引导的自然图像分层分解任务。该数据集通过收集并处理大量自然场景图像，为每张图像提供实例级边界框注释，并基于遮挡感知分解技术生成对应的干净背景层和物体级前景RGBA图层。数据集划分为训练集、完全注释的基准子集RevealLayerBenchMark-200以及仅含边界框注释的野样子集RevealLayerBenchMark-wild，结构清晰，便于研究者根据需求选择使用。

使用方法

使用RevealLayer-100K数据集时，用户可依据HuggingFace仓库中的目录结构，通过Python脚本加载相应分片的metaData.json文件，利用PIL库读取full_image、background及LayerInfoRaw字段对应的图像，并解析detections字段获取边界框坐标。训练集和完全注释基准集可直接用于监督学习，而野样子集则适用于定性分析与鲁棒性测试。注意第三方基准数据需从官方渠道另行获取，并遵守原始许可协议。

背景与挑战

背景概述

RevealLayer-100K数据集由Wang Binhao、Zhao Shihao等研究者在ICML 2026发表的论文《RevealLayer: Disentangling Hidden and Visible Layers via Occlusion-Aware Image Decomposition》中提出，专注于解决基于边界框引导的自然图像分层分解问题。该数据集包含超过10万张训练样本及两个评估基准（RevealLayerBenchMark-200和RevealLayerBenchMark-wild），核心任务旨在将输入RGB图像与实例边界框分解为干净的背景与各对象级前景RGBA层。该工作填补了传统图像分割与编辑任务中无法有效处理遮挡场景下隐含层分解的空白，推动了分层图像编辑、物体移除及图像修复等计算机视觉领域的方向发展。

当前挑战

该数据集所解决的领域挑战在于，自然图像中广泛存在的遮挡现象导致现有图像分解方法无法同时分离可见与隐藏的物体层，尤其当多个物体相互重叠时，传统依据单一输入图像进行分割或抠图的算法难以恢复被遮挡物体的完整前景与未被遮挡的背景。在构建过程中，数据集的挑战主要体现为：需要从复杂真实场景中获取大量包含精确逐层RGBA标注的训练数据，同时确保边界框引导信号与真实层分解的严格对齐；此外，对于无真实标注的野外图像（RevealLayerBenchMark-wild），仅能提供边界框作为弱监督线索，如何在此类设定下评估模型对现实世界中遮挡复杂性的鲁棒性也构成显著困难。

常用场景

经典使用场景

RevealLayer-100K数据集专为基于边界框引导的层次化图像分解任务而构建，在计算机视觉领域开辟了遮蔽感知分解的新范式。给定一张自然图像及其对应的实例边界框，该数据集要求模型将场景精确拆解为干净的背景和多个物体级前景层，每个前景层以RGBA格式呈现。这一任务超越了传统的图像抠图或背景去除，深入探索了复杂遮挡场景中隐藏与可见层之间的相互作用机制，为理解图像内在结构提供了全新的研究视角。

解决学术问题

该数据集的核心价值在于解决了自然图像中遮挡导致的层次分解难题，这是传统图像分割、背景修复和抠图方法难以统合处理的学术瓶颈。通过提供大规模、高质量且带有精细层次标注的训练与基准数据，RevealLayer-100K使得模型能够在真实遮挡场景中同时完成背景重建、前景层提取与层间关系建模。这一突破推动了图像编辑领域从‘单层处理’向‘分层解耦’的范式转变，为后续研究奠定了坚实的数据基础与评估标准。

实际应用

在实际应用中，RevealLayer-100K所支撑的技术可广泛应用于专业图像编辑软件中的智能对象移除、分层合成与背景替换。设计人员能够通过简单的边界框指定，快速分离出被部分遮挡的物体并独立编辑，极大提升了图像后期处理的效率与精确度。此外，该数据集在增强现实场景理解、自动驾驶视觉解析以及影视特效制作等领域也展现出巨大潜力，为需要精细分层操作的实时交互系统提供了可落地的技术方案。

数据集最近研究