Görlitz Rail Test Center CV Dataset 2024 (RailGoerl24)

Name: Görlitz Rail Test Center CV Dataset 2024 (RailGoerl24)
Creator: 德国联邦铁路管理局
Published: 2025-04-01 04:18:39
License: 暂无描述

arXiv2025-04-01 更新2025-04-08 收录

下载链接：

https://data.fid-move.de/dataset/railgoerl24

下载链接

链接失效反馈

官方服务：

资源简介：

RailGoerl24是由德国联邦铁路管理局等机构创建的一个视觉数据集，包含在德国格尔利茨铁路试验中心录制的12,205帧全高清视觉数据。该数据集主要用于支持无人驾驶列车在引导运输中的开发，包含33,556个关于人体对象的边界框标注。数据集还包含对应区域的地面LiDAR扫描数据。RailGoerl24可应用于列车自动安全监控系统以及车站工作人员的安全系统开发。

RailGoerl24 is a visual dataset developed by institutions including the German Federal Railway Administration. It contains 12,205 full-high-definition visual frames recorded at the Görlitz Railway Test Center in Germany. This dataset is primarily intended to support the development of driverless trains in guided transportation, and includes 33,556 bounding box annotations for human subjects. It also provides ground LiDAR scan data of the corresponding areas. RailGoerl24 can be applied to the development of automatic train safety monitoring systems and safety systems for station staff.

提供机构：

德国联邦铁路管理局

创建时间：

2025-04-01

搜集汇总

数据集介绍

构建方式

RailGoerl24数据集的构建依托于德国Görlitz铁路测试中心的实地采集，采用单台全高清RGB摄像头（Axis P3925-R，1920×1080分辨率，85.7°水平视场角）以25Hz帧率记录列车运行场景。为确保数据多样性，研究团队设计了涵盖不同年龄、着装、体态及群体规模的人类活动场景，并辅以Leica RTC360激光雷达扫描获取环境三维点云数据（总计3.84亿点）。标注流程采用EYYES GmbH开发的半自动算法预标注后人工校验，最终形成12,205帧视频帧中33,556个'行人'类别的边界框标注，较纯人工标注节省60%时间成本。

特点

该数据集的核心价值体现在铁路场景的特殊性与数据多样性：其不仅包含常规行走行人，还收录了铁轨躺卧、袋鼠装等极端案例，弥补了现有公开数据集中铁路边缘场景的空白。所有人类演员面部数据未经模糊处理，避免了标注偏差导致的'Clever Hans'效应。时空维度上，数据严格限定于2024年4月24日单日采集，确保环境光照一致性；地理维度则覆盖德国铁路典型开放线路场景，与封闭式地铁环境形成鲜明对比。配套的LiDAR点云数据为多模态研究提供了空间几何参照。

使用方法

RailGoerl24主要服务于无人驾驶列车视觉系统的研发，使用者可通过帧级标注开展行人检测模型的训练与验证。数据以61段视频序列组织，建议按15帧间隔抽取样本以保证时序独立性。激光雷达数据可用于数字孪生构建或背景消除算法开发。研究者需注意数据局限性：非立体视觉架构、反向行驶采集特性及缺乏夜间场景。该数据集同时适用于轨道安全监控、职业安全系统等衍生研究，相关成果可通过DOI:10.57806/4d2fpj1y获取。

背景与挑战

背景概述

Görlitz Rail Test Center CV Dataset 2024 (RailGoerl24)是由德国联邦铁路局铁路交通研究中心(DZSF)、EYYES GmbH以及德累斯顿工业大学等机构联合开发的计算机视觉数据集，旨在推动无人驾驶列车运营技术发展。该数据集于2024年4月在德国格尔利茨铁路测试中心采集，包含12,205帧全高清RGB图像和配套LiDAR点云数据，共标注33,556个行人边界框。作为轨道交通领域稀缺的公开数据集，RailGoerl24填补了铁路特定环境下行人检测数据不足的空白，为自动列车运行系统(ATO)中危险区域监测功能的机器学习算法开发提供了关键训练资源。其创新性体现在涵盖多样化铁路场景、保留原始人脸特征以规避算法偏见，以及同步采集多模态传感器数据等方面。

当前挑战

铁路场景行人检测面临三大核心挑战：首先，开放轨道环境中光照变化、复杂背景及远距离小目标检测等特性导致传统计算机视觉算法性能显著下降；其次，现有公开数据集在规模和质量上远逊于道路领域，RailGoerl24需解决数据稀缺条件下模型泛化能力不足的问题。在构建过程中，研究团队遭遇多重技术难题：安全规范限制使得必须采用列车倒车方式采集数据，导致无法模拟真实前进运动场景；为保持数据真实性而保留未模糊处理的人脸特征，需平衡隐私保护与算法训练需求；多传感器数据时空配准与半自动标注流程的优化也构成显著技术障碍。

常用场景

经典使用场景

RailGoerl24数据集在自动驾驶列车系统的开发中扮演了关键角色，特别是在视觉感知和障碍物检测领域。该数据集通过提供高质量的RGB图像和LiDAR点云数据，为机器学习算法提供了丰富的训练素材，用于识别轨道上的行人和其他潜在障碍物。其多样化的场景设计，包括不同年龄、服装和姿态的行人，使得该数据集在测试和验证模型鲁棒性方面具有重要价值。

衍生相关工作

RailGoerl24数据集催生了一系列相关研究，特别是在多传感器融合和3D场景理解领域。例如，基于该数据集的LiDAR点云数据，研究人员开发了新的背景减除算法和数字地图生成方法。此外，该数据集还被用于改进合成数据生成系统，如TrainSim框架，以生成更多样化的铁路场景数据。

数据集最近研究