five

SynDRA-BBox

收藏
arXiv2025-07-22 更新2025-07-24 收录
下载链接:
https://syndra.retis.santannapisa.it
下载链接
链接失效反馈
官方服务:
资源简介:
SynDRA-BBox 是一个专为铁路领域设计的合成数据集,旨在支持在真实铁路场景中进行物体检测和其他视觉任务。该数据集包括相机、深度和 LiDAR 数据,以及多种注释,以支持在铁路环境中评估视觉算法。SynDRA-BBox 是第一个公开可用的合成数据集,支持该领域的 2D 和 3D 物体检测和语义分割任务。数据集包括七个不同的铁路交叉口场景,以及一个大型火车站环境中的额外场景。每个场景都包含多个图像序列,每个序列都关注一种特定的相关对象类型,例如车辆、行人或自然障碍物。数据集还提供了高分辨率 RGB 图像和合成 LiDAR 点云,以及图像和点云域中的详细注释。数据集的创建旨在解决铁路领域缺乏公开可用的大型标注数据集的问题,以支持铁路自动化研究的进展。

SynDRA-BBox is a synthetic dataset specifically designed for the railway domain, aiming to support object detection and other vision tasks in real-world railway scenarios. This dataset includes camera, depth, and LiDAR data, along with various annotations to support the evaluation of vision algorithms in railway environments. SynDRA-BBox is the first publicly available synthetic dataset that supports 2D and 3D object detection as well as semantic segmentation tasks in this domain. The dataset contains seven distinct railway crossing scenarios, plus an additional scenario set in a large railway station environment. Each scenario includes multiple image sequences, with each sequence focusing on a specific relevant object category such as vehicles, pedestrians, or natural obstacles. The dataset also provides high-resolution RGB images and synthetic LiDAR point clouds, alongside detailed annotations in both the image and point cloud domains. The dataset was created to address the scarcity of publicly available large-scale annotated datasets in the railway domain, thereby supporting the advancement of railway automation research.
提供机构:
SETLabs Research GmbH, Munich, Germany; Scuola Superiore Sant’Anna, Pisa, Italy
创建时间:
2025-07-22
原始信息汇总

SynDRA 数据集概述

数据集简介

  • 名称:SynDRA (Synthetic Dataset for Railway Applications)
  • 类型:合成数据集
  • 应用领域:铁路环境语义分割
  • 目的:填补铁路应用领域公开数据集稀缺的空白,支持自动驾驶列车相关研究

数据集内容

SynDRA (基础版)

  • 数据量:80个序列
  • 环境多样性:4种不同环境,包含变化的天气和光照条件
  • 传感器配置:
    • 立体RGB相机系统
      • 分辨率:1920×1080
      • 视场角:90°
      • 基线:0.6 m
      • 安装高度:距轨道3.5 m
      • 帧率:10 FPS
  • 标注类型:
    • 像素级语义分割
    • 每帧相机位姿

SynDRA-BBox (扩展版)

  • 数据量:72个主序列 + 2个额外序列
  • 新增功能:
    • 2D/3D边界框标注
    • 支持铁路环境物体检测
  • 传感器扩展:
    • RGB Camera 0
      • 分辨率:2464x1600
      • 视场角:30°
    • 非重复模式LiDAR (Tele-15)
      • 测距:500 m
      • 视场角:15°
      • 点数/扫描:4800
    • 64线束LiDAR (HDL-64E)
      • 测距:120 m
      • 水平视场角:180°
      • 垂直视场角:26.8°
  • 新增标注:
    • 2D/3D边界框
    • 点级语义分割
    • 深度信息(可达650m)
    • 校准和位姿数据

数据集结构

SynDRA

SynDRA/ ├── Scenario_0/ │ ├── HV/ │ │ ├── Sunny/ │ │ │ ├── Afternoon/ │ │ │ │ ├── RGBCamera_0/ │ │ │ │ │ ├── Bin_folder/ │ │ │ │ │ │ ├── Sce0_sun_aft_000001.bin │ │ │ │ │ │ └── ... │ │ │ │ │ ├── Poses/ │ │ │ │ │ └── Times/ │ │ │ │ ├── RGBCamera_1/ │ │ │ │ ├── SSCamera_0/ │ │ │ │ └── SSCamera_1/ ├── Utils/ │ ├── RGB_bin_to_png.py │ ├── SS_bin_to_png.py │ └── Sensor_Specs.txt

SynDRA-BBox

SynDRA-BBox/ ├── Scenario_0/ │ ├── Bus_0/ │ │ ├── Sunny/ │ │ │ ├── DepthCamera_0/ │ │ │ │ ├── Bin_folder/ │ │ │ │ │ ├── SceBus_0_sun_mor_000000.bin │ │ │ │ │ └── ... │ │ │ │ ├── Poses/ │ │ │ │ └── Times/ │ │ │ ├── NotRepLidar_0/ │ │ │ └── BeamStackLidar_0/ │ │ ├── CameraBBoxes_0.txt │ │ ├── LidarBBoxesBeamsStackLidar_0.txt │ │ └── rail_tumlike_poses.txt ├── Utils/ │ ├── bin_to_png.py │ ├── bin_to_pcd.py │ └── Sensor_Specs.txt

下载信息

  • 总数据量:约1.8TB
  • 下载选项:
    • 完整数据集下载
    • 按场景下载(每个场景包含多个序列)

相关论文

bibtex @inproceedings{d2025syndra, title={SynDRA: Synthetic Dataset for Railway Applications}, author={DAmico, Gianluca and Nesti, Federico and Rossolini, Giulio and Marinoni, Mauro and Sabina, Salvatore and Buttazzo, Giorgio}, booktitle={2025 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)}, pages={3437--3446}, year={2025}, organization={IEEE}}

联系方式

  • 问题反馈邮箱:gianluca.damico@santannapisa.it
搜集汇总
数据集介绍
main_image_url
构建方式
SynDRA-BBox数据集的构建基于Unreal Engine 5虚拟引擎,通过精心设计的铁路场景模拟生成多模态感知数据。研究团队创建了七个平交道口场景和一个大型火车站场景,每个场景包含多个图像序列,重点突出不同障碍物类型(如车辆、行人、自然障碍物)与铁轨的交互。数据采集过程中,列车起始位置设定为距平交道口约350米,以模拟真实危险情境。传感器配置方面,提供2464×1600高分辨率RGB图像及两种LiDAR点云(TELE-15和64线Velodyne HDL-64E),同时包含30°和90°两种视场角的相机数据。三维边界框标注直接利用UE5内置功能生成,确保所有检测相关对象均获得精确标注,即使点云回波稀疏的对象也不例外。
特点
该数据集作为首个面向铁路场景的公开合成数据集,具有三个显著特征:多任务支持性同时提供2D/3D目标检测和语义分割所需的丰富标注;场景多样性涵盖开放场地、平交道口及复杂站台环境,包含车辆、行人、倒伏树木等多类障碍物;传感器完备性集成RGB相机、深度传感器和LiDAR的同步数据,并模拟不同参数配置。特别值得注意的是其标注策略既保持SynDRA原有的语义分割标准,又针对检测任务细化车辆分类(轿车/巴士/卡车)并新增铁路特有障碍物类别,如倒伏岩石等自然危害物。数据集通过10帧批处理方式划分为训练集(70%)、验证集(20%)和测试集(10%),确保时序连贯性。
使用方法
使用SynDRA-BBox需重点关注三个应用维度:基准测试可直接用于训练和评估铁路场景下的3D目标检测模型,建议配合OpenPCDet框架实现;域适应研究可作为合成源域与真实铁路数据(如OSDaR23)进行sim-to-real迁移实验,论文中优化的SSDA3D方法显示其与Waymo数据联合训练能显著提升性能;传感器仿真验证支持不同LiDAR配置(如15线vs64线)的性能对比分析。使用时需注意点云坐标系已调整为与其他数据集对齐的地面坐标系,且当与含强度通道的数据集联合训练时,需为SynDRA-BBox点云补全归一化强度值。官方提供的JSON格式标注文件包含完整的2D/3D边界框信息,配套解析脚本可辅助可视化与分析。
背景与挑战
背景概述
SynDRA-BBox数据集由Mobility Technologies和Scuola Superiore Sant’Anna的研究团队于2025年推出,旨在解决铁路自动化领域中公开标注数据稀缺的核心问题。作为首个专注于铁路场景的合成数据集,其通过Unreal Engine 5构建了包含多传感器数据(相机、LiDAR)及2D/3D边界框标注的虚拟环境,覆盖平交道口、车站等7类典型场景。该数据集突破了铁路行业因安全法规和数据采集成本导致的真实数据获取瓶颈,为半监督域适应方法(如SSDA3D)提供了跨领域验证平台,显著推动了自动驾驶列车感知系统的研发进程。
当前挑战
SynDRA-BBox面临双重挑战:在领域问题层面,需克服铁路场景特有的开放空间稀疏性、异于汽车领域的语义尺度差异(如长距离制动检测),以及合成数据与真实LiDAR点云的域偏移问题;在构建过程中,需精细平衡虚拟环境的物理真实性(如行人几何建模精度)与传感器噪声模拟,同时设计兼顾Waymo汽车数据与铁路专属障碍物(如倒伏树木)的混合标注策略。实验表明,直接迁移合成数据时AP3D指标下降达31.89%,凸显了跨模态域适应的复杂性。
常用场景
经典使用场景
在铁路自动化领域,SynDRA-BBox数据集为2D和3D目标检测任务提供了丰富的合成数据支持。该数据集通过模拟铁路交叉口和车站等典型场景,生成了包含车辆、行人及自然障碍物的多模态数据,并辅以精确的2D/3D边界框标注。研究者在开发铁路环境感知算法时,可利用该数据集进行模型训练与验证,特别是在缺乏真实标注数据的场景下,SynDRA-BBox能够有效弥补铁路领域的数据空白。
解决学术问题
SynDRA-BBox主要解决了铁路自动化研究中真实标注数据稀缺的学术难题。通过提供高质量的合成数据,该数据集支持了半监督域适应技术的应用,使得模型能够将从合成数据中学到的知识迁移到真实铁路环境中。实验证明,结合Waymo等跨领域数据集,SynDRA-BBox能显著提升目标检测模型在真实铁路场景中的性能,尤其在行人检测任务上实现了176.5%的Closed Gap指标突破。
衍生相关工作
SynDRA-BBox的发布催生了一系列铁路感知领域的创新研究。基于该数据集优化的SSDA3D域适应框架被扩展应用于多传感器融合场景;后续工作如TrainSim仿真平台借鉴了其虚拟环境构建方法;而OSDaR23真实数据集的研究团队也采用SynDRA-BBox进行跨域预训练。这些衍生成果共同推动了从合成数据到真实铁路系统的知识迁移技术发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作