five

garrying/PMD

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/garrying/PMD
下载链接
链接失效反馈
官方服务:
资源简介:
PMD数据集是一个用于镜像表面检测的基准数据集,首次在CVPR 2020论文《Progressive Mirror Detection》中提出。该数据集包含5,666张图像,分为训练集(5,095张)和测试集(571张)。每张图像都有对应的镜像分割掩码(mask),训练集还包含镜像边缘图(edge)。数据集主要用于图像分割、边缘检测和计算机视觉任务。

The PMD dataset is a benchmark for mirror surface detection introduced in the CVPR 2020 paper *Progressive Mirror Detection*. It contains 5,666 images, split into training (5,095 images) and test (571 images) sets. Each image has a corresponding binary mirror segmentation mask, and the training set also includes mirror edge maps. The dataset is primarily used for image segmentation, edge detection, and computer vision tasks.
提供机构:
garrying
搜集汇总
数据集介绍
main_image_url
构建方式
PMD数据集是渐进式镜像检测领域的代表性基准,于CVPR 2020首次提出。该数据集共包含5,666张真实场景图像,其中训练集为5,095张,测试集为571张。每张训练样本均提供三项核心标注:原始RGB场景照片、二值化的镜面分割掩码以及镜面边缘图;测试集则仅包含原始图像与分割掩码。数据集以Parquet格式存储,并附有辅助脚本支持还原为原始文件夹结构(图像、掩码、边缘分目录存放),便于研究者灵活调用。
特点
PMD数据集的独特之处在于其多任务标注设计:同时提供镜面区域分割掩码与边缘检测图,尤其边缘图仅在训练集中出现,赋予模型从边缘信息中渐进学习的能力。图像来源于多样化的室内外场景,涵盖了不同光照、角度和反射干扰,具有高度现实性与挑战性。此外,该数据集规模适中,训练/测试划分明确(约9:1),为镜面检测算法的公平对比提供了稳固基础。
使用方法
研究人员可通过HuggingFace Datasets库便捷加载数据集,调用`load_dataset('garrying/PMD')`即可获得训练与测试分片。每条数据包含唯一图像ID、RGB图像、分割掩码及可选边缘图,均以PIL图像格式呈现。针对需还原原始文件结构的场景,官方提供`parquet_to_raw.py`脚本,支持一键导出为`image/`、`mask/`、`edge/`子目录布局。此外,配套的PMDNet预训练权重在HuggingFace Model Hub发布,可直接用于微调或推理。
背景与挑战
背景概述
镜像表面检测是计算机视觉中一项具有挑战性的任务,旨在从自然场景中准确识别反射表面,其在机器人导航、增强现实与视觉监控等领域具有广泛的应用前景。然而,由于镜面区域与周围环境具有高度相似的外观特征,传统分割方法难以有效捕捉其几何与语义边界。在此背景下,来自香港城市大学的林嘉颖、王国栋与刘云生等研究者于2020年CVPR会议上提出了渐进式镜像检测方法,并同步发布了PMD(Progressive Mirror Detection)数据集。该数据集包含5095张训练图像与571张测试图像,每张图像均提供精心标注的二值分割掩膜,训练集还额外包含边缘标注图,旨在为镜像检测研究提供标准化评估基准。自发布以来,PMD数据集已成为镜像检测领域最具影响力的公开基准之一,推动了面向反射表面感知的深度学习模型的发展。
当前挑战
PMD数据集所聚焦的核心领域挑战在于如何从复杂场景中精准分离出反射表面,这要求模型能够区分视觉上相似的镜面区域与真实背景,同时应对光照变化、遮挡、多视角反射等复杂干扰。此外,构建该数据集本身亦面临显著困难:镜像区域的标注远比常规物体分割更为模糊,因为反射内容会随着相机视角与周围环境动态变化;标注人员需依据物理边缘而非语义边界进行精确描绘,增加了标注成本与主观偏差。边缘注释的引入进一步提升了数据构建的复杂性,需要同时确保内外部轮廓的准确性与一致性。这些挑战共同塑造了PMD数据集在算法评估与模型设计中的独特价值,也持续激励着研究社区探索更加鲁棒的镜像感知方案。
常用场景
经典使用场景
PMD数据集作为镜面检测领域的基准,其经典使用场景聚焦于图像中镜面区域的精确分割与边缘定位。研究者常利用该数据集训练深度神经网络,以从复杂室内外场景中识别出反射面,并生成像素级的二值掩膜和边缘图。该数据集提供了5,095张训练图像及对应的完整标注,覆盖了多种光照、纹理和几何形态的镜面实例,为模型学习镜面固有的视觉特征(如反射、对称性)奠定了数据基础。其采用的分割与边缘联合监督范式,有效推动了端到端镜面感知技术的发展,成为后续方法性能对比的标准测试平台。
解决学术问题
PMD数据集着力解决了计算机视觉中长期被忽视的镜面检测问题,填补了该领域缺乏大规模高质量标注数据的空白。在学术研究中,镜面常因反射内容干扰而导致传统语义分割模型失效,而PMD通过提供多样化的真实场景标注,促使研究者探索如何区分镜面区域与其反射的虚拟内容。该数据集的提出促使学界从单一的分割任务拓展至多任务联合学习,包括镜面边缘检测、反射属性建模及场景理解。其公开benchmark属性显著降低了镜面检测的入门门槛,加速了该方向从理论探讨向实证研究的转型,并为后续的泛化性研究提供了可靠的评价框架。
衍生相关工作
围绕PMD数据集诞生了一系列具有代表性的经典工作,其中最具影响力的是其提出的PMDNet网络架构。该模型首创了渐进式检测范式,通过由粗到精的多阶段特征融合机制,分别预测镜面区域和边缘,有效解决了伪影干扰问题。后续研究在此基础上发展出基于Transformer的镜面感知模块、多尺度上下文增强策略,以及无监督域适应方法,以应对数据标注成本高昂的现实挑战。部分工作进一步将镜面检测与深度估计、物体重识别任务结合,形成了多任务联合学习的延伸方向。这些衍生工作不仅验证了PMD数据集的长期科研价值,也推动了镜面相关视觉问题从单一检测迈向综合场景理解的演进脉络。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作