DOORS: Dataset fOr bOuldeRs Segmentation
收藏arXiv2022-10-29 更新2024-07-18 收录
下载链接:
https://zenodo.org/records/7107409
下载链接
链接失效反馈官方服务:
资源简介:
DOORS数据集由米兰理工大学的Mattia Pugliatti和Francesco Topputo创建,旨在为小天体表面巨石的检测提供支持,特别是在视觉导航和危险检测等应用中。数据集包含两个子集DS1和DS2,分别包含30181和20095个样本,这些样本是通过Blender软件生成的合成图像。创建过程涉及复杂的渲染和后处理步骤,确保数据集在光照条件和巨石形状上的多样性。该数据集主要用于开发和测试基于数据驱动的图像处理算法,以解决小天体导航中的巨石识别和分割问题。
The DOORS dataset was created by Mattia Pugliatti and Francesco Topputo from Politecnico di Milano, aiming to support boulder detection on the surfaces of small celestial bodies, particularly for applications including visual navigation and hazard detection. The dataset comprises two subsets, DS1 and DS2, which hold 30181 and 20095 samples respectively. All samples are synthetic images generated via Blender software. The dataset development involves complex rendering and post-processing steps to ensure diversity in lighting conditions and boulder shapes. This dataset is primarily used for developing and testing data-driven image processing algorithms to address boulder recognition and segmentation problems in small celestial body navigation.
提供机构:
米兰理工大学
创建时间:
2022-10-29
搜集汇总
数据集介绍

构建方式
小行星表面巨石检测是深空探测自主导航与危险规避的关键技术,然而光照条件剧烈变化与公开标注数据集的匮乏严重制约了数据驱动算法的发展。为此,DOORS数据集基于Blender开源渲染引擎构建,采用四阶段生成流水线:首先生成包含相机位姿、光照参数及巨石属性的文本输入文件,随后在虚拟环境中渲染256×256像素的灰度图像与对应掩膜,再经随机裁剪至128×128像素并添加高斯噪声以模拟真实传感器退化,最终整理为可用于模型训练的标准化格式。数据集包含两个子集:DS1聚焦单巨石场景,通过随机缩放30种巨石原型并调节表面粗糙度与反照率实现多样性;DS2则以(65803) Didymos小行星高精度网格为基底,利用粒子系统散布巨石群体,并引入小行星自转参数以增强场景真实感。
使用方法
数据集以拆分形式提供,每个样本包含128×128像素的噪声灰度图像、无阴影掩膜、含阴影掩膜及标注文件,适用于巨石实例分割、质心回归与导航特征点检测等任务。用户可直接加载图像-掩膜对训练深度学习模型,其中阴影掩膜可辅助模型学习光照鲁棒性特征。标注文件提供巨石在原始与后处理图像中的像素坐标、边界框及填充参数,便于自定义裁剪与数据增强。DS1与DS2分别侧重单体巨石识别与复杂多巨石场景理解,研究者可结合任务需求选择子集或联合训练。数据集已开源发布于Zenodo(DOI: 10.5281/zenodo.7107409),并附有Blender环境配置说明与统计特性分析,支持算法复现与扩展研究。
背景与挑战
背景概述
在小天体探测任务中,精确识别表面石块对于危险规避与自主导航至关重要,然而传统算法在应对不规则形状、光照剧烈变化及石块分布多样性时表现欠佳。2022年,意大利米兰理工大学Mattia Pugliatti与Francesco Topputo团队发布了DOORS数据集,旨在推动基于深度学习的石块分割算法研究。该数据集包含两个子集:DS1聚焦于单一石块在可控环境下的分割,DS2则基于(65803) Didymos小行星高分辨率网格模拟真实场景,共生成超过6万对图像-掩膜样本。通过开源Blender渲染管线与详尽的统计特性分析,DOORS为视觉导航、目标检测及语义分割任务提供了标准化基准,填补了小天体石块标注数据集公开可用的空白,对深空探测自主能力提升具有里程碑意义。
当前挑战
DOORS数据集所解决的领域挑战在于:石块形状高度非规则、表面反照率与背景混杂、光照相位角剧烈变化(0°至90°),导致传统方法难以鲁棒分割。具体而言,构建过程中面临四大难点:一、需通过Blender粒子系统模拟真实石块种群分布,并兼顾形状、尺度与反照率随机性;二、光照条件需在保持物理散射定律(Akimov模型)的同时,生成平衡与非平衡相位角分布以覆盖极端工况;三、后处理中需通过随机裁剪与高斯噪声注入弥合合成与真实图像的域差异,避免过拟合;四、数据集需同时提供带阴影与无阴影掩膜,以支持阴影鲁棒性训练。这些挑战共同决定了数据集在算法泛化性与任务适配性上的关键作用。
常用场景
经典使用场景
DOORS数据集专为小天体表面砾石检测与分割任务而设计,在深空探测视觉导航领域中具有里程碑意义。该数据集通过Blender渲染引擎生成大量合成图像-掩码对,模拟了复杂光照条件、多样砾石形态及表面纹理变化,为基于深度学习的砾石识别算法提供了高质量训练与验证素材。其经典使用场景涵盖砾石实例分割、中心点回归以及阴影掩码生成,研究者可借助该数据集训练鲁棒的感知模型,以应对真实任务中光照剧烈波动与目标几何多样性带来的挑战。
解决学术问题
该数据集有效缓解了小天体视觉感知研究中公开标注数据匮乏的瓶颈问题。学术上,它解决了三大核心难题:一是提供平衡与非平衡相位角分布的多场景样本,支持模型在光照变化下的泛化性研究;二是通过随机裁剪与噪声注入技术,缩小合成域与真实域之间的差距,为域自适应算法奠定基础;三是量化分析了砾石与表面反照率、尺度等统计特性,助力探索数据驱动方法在小天体自主导航中的可行性,推动了计算机视觉与深空探测的交叉研究进程。
实际应用
在实际工程中,DOORS数据集直接服务于深空探测器的自主导航与避障系统。其生成的合成图像可用于训练砾石检测模块,使探测器在接近小行星或彗星表面时能够实时识别危险障碍物,从而规划安全着陆路径。此外,该数据集还可辅助视觉里程计与地形相对导航算法开发,通过砾石分布特征实现高精度位姿估计。欧洲空间局等机构的行星防御与采样返回任务中,此类技术已逐步成为提升任务自主性与可靠性的关键支撑。
数据集最近研究
最新研究方向
在深空探测与行星科学领域,小天体表面碎石(boulder)的精确检测与分割是当前计算机视觉与自主导航研究的前沿热点。DOORS数据集应运而生,其通过Blender开源引擎构建了高保真合成环境,模拟了碎石形态多样性、光照条件剧烈变化及表面纹理复杂等真实场景挑战,为数据驱动的碎石分割算法提供了首个公开的大规模标注基准。该数据集不仅包含单碎石场景(DS1)与真实小行星(如Didymos)多碎石场景(DS2),还通过统计平衡设计(如相位角分布调控)提升了模型在不同光照下的泛化能力。这一工作直接回应了当前小行星探测任务(如NASA的DART任务与ESA的Hera任务)中对实时、鲁棒视觉导航系统的迫切需求,推动了从传统图像处理向深度学习方法的范式转变,对实现自主着陆、危险规避及科学采样具有里程碑式的战略意义。
相关研究论文
- 1DOORS: Dataset fOr bOuldeRs Segmentation. Statistical properties and Blender setup米兰理工大学 · 2022年
以上内容由遇见数据集搜集并总结生成



