garrying/GSD-S

Name: garrying/GSD-S
Creator: garrying
Published: 2026-05-01 07:01:25
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/garrying/GSD-S

下载链接

链接失效反馈

官方服务：

资源简介：

GSD-S是一个用于玻璃表面检测的数据集，并增加了每像素的语义标签。该数据集在NeurIPS 2022的论文《Exploiting Semantic Relations for Glass Surface Detection》中提出。每个样本包含一张RGB照片、一个二进制玻璃掩码和一个43类语义分割图，支持联合玻璃检测和场景语义推理。数据集分为训练集（3,911个样本）和测试集（608个样本），总计4,519个样本。图像分辨率为640×480像素（JPEG格式），所有标注图为PNG格式。数据集包含的列有：image_id（原始文件名）、image（RGB照片）、mask（二进制玻璃掩码）、seg（语义分割图）和seg_colored（用于可视化的假彩色分割图）。语义类别共有43类，包括未知、墙、玻璃、地板、天花板等。

GSD-S is a glass surface detection dataset augmented with per-pixel semantic labels, introduced in the NeurIPS 2022 paper "Exploiting Semantic Relations for Glass Surface Detection". Each sample pairs an RGB photograph with a binary glass mask and a 43-class semantic segmentation map, enabling joint glass detection and scene-semantic reasoning. The dataset is divided into a training set (3,911 samples) and a test set (608 samples), totaling 4,519 samples. Images are 640 × 480 pixels (JPEG format), and all annotation maps are PNG format. The dataset includes the following columns: image_id (original filename stem), image (RGB photograph), mask (binary glass mask), seg (semantic segmentation map), and seg_colored (false-color rendering of seg for visualization). There are 43 semantic classes in total, including unknown, wall, glass, floor, ceiling, etc.

提供机构：

garrying

搜集汇总

数据集介绍

构建方式

GSD-S数据集源自NeurIPS 2022会议论文《Exploiting Semantic Relations for Glass Surface Detection》，旨在突破玻璃表面检测中语义信息缺失的瓶颈。该数据集精心构建了4,519对高分辨率样本，其中训练集3,911张，测试集608张，每张图像尺寸统一为640×480像素。除了标准的RGB图像外，每份样本均提供二值玻璃掩膜与一张包含43个语义类别的逐像素语义分割图，通过联合标注实现玻璃区域与场景语义的协同建模。这种多层次标注策略，使得模型能够在理解复杂室内外场景语义关系的基础上，更精准地定位透明玻璃表面。

使用方法

通过HuggingFace Datasets库可便捷加载GSD-S数据集，使用`load_dataset('garrying/GSD-S')`命令即可获取训练与测试分片。每个样本包含图像ID、RGB照片、二值玻璃掩膜、语义索引图及彩色语义图五个字段，支持直接调用PIL库进行可视化。若需恢复为原始文件结构，可运行`parquet_to_raw.py`脚本，该脚本支持从HuggingFace仓库或本地缓存中提取，最终生成按训练/测试分组的images、masks、segs及segs_colored子目录，便于传统计算机视觉流程的衔接。

背景与挑战

背景概述

玻璃作为一种透明且具有反射特性的材料，常在视觉场景中与背景融为一体，导致传统的语义分割与目标检测方法难以准确识别其边界与存在区域。为攻克这一难题，来自香港城市大学的Jiaying Lin、Yuen-Hei Yeung与Rynson W.H. Lau等研究人员在2022年NeurIPS会议上提出了GSD-S数据集，旨在通过融合像素级语义标签来增强玻璃表面检测的鲁棒性。该数据集包含4,519张640×480像素的RGB图像，每张图像均配有二值玻璃掩膜和涵盖43个类别的语义分割图，极大地推动了玻璃感知与场景理解交叉领域的研究进展。GSD-S的发布不仅为玻璃检测提供了标准化的评测基准，更启发学界探索如何利用语义关系来解析透明物体与周边环境的相互作用，对计算机视觉中的透明物体感知任务产生了深远影响。

当前挑战

GSD-S数据集主要解决的是传统检测方法无法利用上下文语义信息来区分透明玻璃区域与非玻璃区域的领域难题，其挑战在于玻璃的光学特性常导致边界模糊与颜色失真，单纯依赖彩色图像特征极易产生误判。在构建过程中，研究人员面临的主要挑战包括：第一，高精度标注的获取难度大，需在复杂室内外场景中准确勾勒玻璃与其他43类语义对象的边界；第二，标注一致性控制极为苛刻，同一场景中的透明玻璃可能因光照角度和背景纹理的差异而被不同标注者赋予不同的边界；第三，需设计合理的评估指标来衡量兼具检测精度与语义理解能力的模型性能，最终采用IoU、F-measure、MAE及BER等多维度指标来避免单一度量带来的偏见。

常用场景

经典使用场景

GSD-S数据集专为玻璃表面检测任务而设计，其核心特色在于为每张RGB图像同步提供了二值玻璃掩码和涵盖43个类别的语义分割标注。这一精心构建的配对结构，使得研究者能够在像素级别上同时探索“玻璃是什么”与“玻璃周围是什么”的双重问题。数据集共包含4519张分辨率为640×480的图像，划分为训练集和测试集，其规模适中，既保证了模型训练的充分性，又便于快速迭代实验。经典的使用范式是以RGB图像为输入，输出高精度的玻璃区域预测，并利用同步的语义信息作为辅助监督或推理线索，从而显著提升玻璃检测在复杂场景下的鲁棒性。

解决学术问题

在计算机视觉领域，玻璃表面检测长期受困于玻璃的透明性和反射特性，导致传统的边缘或纹理特征难以有效识别。GSD-S数据集的核心贡献在于突破了这一瓶颈，它将玻璃检测从单纯的低层次视觉任务提升为需要高层语义理解的推理问题。通过引入43类精细的语义标签，数据集促使学术界重新审视玻璃与周围环境（如墙壁、窗户、门、镜子等）之间的内在语义关联。研究者得以验证和提出诸如“语义关系挖掘”等新范式，证明理解场景中物体的共现逻辑能有效纠正因透明性导致的误检和漏检，从而推动了透明物体感知这一前沿方向的理论发展。

实际应用

玻璃表面检测在实际应用中具有广泛的潜在价值。在自动驾驶领域，GSD-S数据集训练的模型能够锐利识别建筑物上的玻璃幕墙或车窗，避免因视觉错觉导致碰撞事故的发生，提升感知系统的安全性。在机器人导航与操作中，准确检测玻璃门或透明展柜是完成自主穿越或避让任务的前提，该数据集为这类环境理解提供了关键的技术支撑。此外，在增强现实（AR）设备中，精准的玻璃表面定位能够优化虚拟物体的投射策略，避免因透明材质的语义混淆而导致的渲染错误。该数据集所提供的语义上下文，还使其能够应用于建筑数字化重建和室内场景理解等任务中。

数据集最近研究