Synset-Signset-Germany
收藏Synset Signset Germany 数据集概述
数据集基本信息
- 数据集名称: Synset Signset Germany
- 创建者: Anne Sielemann, Lena Lörcher, Max-Lion Schumacher, Stefan Wolf, Masoud Roschani, Jens Ziehn, Juergen Beyerer
- 所属机构: Fraunhofer IOSB 和 Fraunhofer IPA, Germany
- 发布日期: 2024年
- 许可证: CC-BY 4.0
- 语言: 英语
- 任务类别: 图像分类、图像分割
- 标签: 交通标志识别、合成数据、Synset、OCTAS
- 数据规模: 100K < n < 1M
数据集描述
Synset Signset Germany 是一个为德国交通标志识别任务设计的合成数据集。它包含总计 105,500 张图像,涵盖 211 个不同的德国交通标志类别,其中包括新发布(2020年)且相对罕见的交通标志。数据集中的前 43 个类别子集旨在作为知名数据集 German Traffic Sign Recognition Benchmark (GTSRB) 的“合成孪生”版本,因此非常适合用于比较真实世界数据和合成数据。得益于丰富的元数据,该数据集也可用于可解释人工智能(XAI)或鲁棒性分析和系统测试等应用场景。
数据集内容与结构
- 图像总数: 105,500 张 RGB 图像
- 类别数量: 211 个德国交通标志类别
- 每类图像数: 500 张
- 渲染引擎: 提供两个配置版本
- Cycles: 使用路径追踪引擎 Cycles 渲染
- OGRE: 使用光栅化引擎 OGRE 渲染
- 数据分割: 每个配置均提供训练集和验证集分割
- 数据文件格式: Parquet
- 伴随数据: 每张渲染图像包含原始图像、语义分割图像、掩码图像以及详细的元数据。元数据涵盖交通标志状态(方向、上方标志、下方标志等)、环境(白天、对比度、位置等)和成像效果(噪声水平、运动模糊强度、自动曝光控制误差等)。
数据集创建
- 生成方法: 基于 Fraunhofer 仿真平台 OCTAS®,遵循物理渲染框架。结合了数据驱动和分析建模方法的优点:采用基于 GAN 的纹理生成来产生数据驱动的污垢和磨损伪影,从而生成独特且逼真的交通标志表面;同时,分析性场景调制确保了物理上准确的照明和适当的几何变换,并支持对渲染场景进行细粒度参数化。
- 源数据:
- 交通标志模板图像来源于维基百科的德国交通标志图集。
- 基于图像的照明使用了来自 PolyHaven 的 327 张环境贴图。
- 作为遮挡物的 3D 树木几何体源自 PolyHaven。
- 标注过程: 大部分标注(包括掩码、分割图像、相机参数、伪影和环境条件)基于场景生成/渲染过程中创建的真实数据。语义分割图像使用 OGRE 渲染引擎插件生成。唯一的手动标注是根据德国交通法规和真实世界示例,对允许的上方和下方标志进行标记。
主要用途
- 直接用途:
- 训练用于德国交通标志识别任务的机器学习模型。
- 分析合成数据集与真实世界交通标志识别数据集(尤其是密切相关的 GTSRB 数据集)之间的差异。
- 利用每张图像的详细元数据测试交通标志识别任务的机器学习模型。
- 范围外用途: 不建议将本数据集用于关键应用,特别是欧洲《人工智能法案》附件 III 中规定的高风险应用(包括“用于自然人的‘实时’和‘事后’远程生物识别识别的 AI 系统”和“旨在用作道路交通管理和运营中安全组件的 AI 系统”),除非已对该数据集的适用性进行详尽研究。
局限性与注意事项
- 交通标志: 磨损生成仅限于颜色褪色、划痕、螺丝孔和贴纸残留等伪影。不包括复杂的贴纸、涂鸦或污垢。未包含逆反射图案,也未模拟逆反射。交通标志仅安装在金属标志杆上。
- 环境: 环境变化不包括恶劣天气条件(雪、雨滴、雾等)。
- 遮挡: 所有包含的遮挡或阴影均来自单一的 3D 树木几何体。
- 相机: 仅使用一组相机内参,仅模拟一种相机镜头类型(基于 Tamron M112FM35 35 mm 镜头)。可以假设所模拟的成像伪影集并不完整。
- 推荐: 建议主要将数据集用于科学研究。应用于实际用例时应包含人工监督,并详尽评估其对特定目的的适用性,包括域偏移的影响。
引用信息
-
论文标题: Synset Signset Germany: A Synthetic Dataset for German Traffic Sign Recognition
-
会议: 2024 IEEE 27th International Conference on Intelligent Transportation Systems (ITSC)
-
BibTeX:
@inproceedings{synset_signset_ger_sielemann_2024, title={{Synset Signset Germany: A Synthetic Dataset for German Traffic Sign Recognition}}, author={Sielemann, Anne and Loercher, Lena and Schumacher, Max-Lion and Wolf, Stefan and Roschani, Masoud and Ziehn, Jens and Beyerer, Juergen}, booktitle={2024 IEEE 27th International Conference on Intelligent Transportation Systems (ITSC)}, year={2024} }
-
APA: Sielemann, A., Loercher, L., Schumacher, M., Wolf, S., Roschani, M., Ziehn, J., and Beyerer, J. (2024). Synset Signset Germany: A Synthetic Dataset for German Traffic Sign Recognition. In 2024 IEEE 27th International Conference on Intelligent Transportation Systems (ITSC).
相关链接
- 数据集官网: https://synset.de/datasets/synset-signset-ger/
- 论文链接: https://ieeexplore.ieee.org/abstract/document/10920175
- arXiv 链接: https://arxiv.org/abs/2512.05936
- GTSRB 子集: https://huggingface.co/datasets/FraunhoferIOSB/Synset-Signset-Germany-GTSRB-Subset
- 许可证链接: https://creativecommons.org/licenses/by/4.0/
资助方
- Fraunhofer 内部项目,资助号 PREPARE 40-02702,属于 ML4Safety 项目。
- 德国联邦经济事务和气候行动部,在“新车辆和系统技术”计划内,属于 AVEAS 研究项目的一部分。
联系方式
- Anne Sielemann: anne.sielemann@iosb.fraunhofer.de
- Jens Ziehn: jens.ziehn@iosb.fraunhofer.de
- 机构网址: https://www.iosb.fraunhofer.de



