five

Synset-Signset-Germany-GTSRB-Subset

收藏
Hugging Face2026-03-06 更新2026-03-07 收录
下载链接:
https://huggingface.co/datasets/FraunhoferIOSB/Synset-Signset-Germany-GTSRB-Subset
下载链接
链接失效反馈
官方服务:
资源简介:
Synset Signset Germany - GTSRB 子集是一个专注于德国交通标志识别的合成数据集。该数据集包含了与知名GTSRB数据集相同的43个交通标志类别,被视为其“合成孪生”版本。每个类别包含500张图像,总计21,500张图像。数据集适用于图像分类和图像分割任务,特别适合科学研究和交通标志识别技术的开发。数据集采用CC-BY 4.0许可,由Fraunhofer IOSB和Fraunhofer IPA的研究团队开发,并得到了Fraunhofer内部计划和德国联邦经济事务和气候行动部的资助。使用该数据集时,建议主要用于科学研究,实际应用需包含人工监督和详尽评估以确保适用性。
创建时间:
2026-03-03
原始信息汇总

Synset Signset Germany - GTSRB Subset 数据集概述

数据集基本信息

  • 数据集名称: Synset Signset Germany - GTSRB Subset
  • 任务类别: 图像分类、图像分割
  • 主要语言: 英语
  • 标签: 交通标志识别、合成数据、Synset、OCTAS
  • 许可证: CC-BY 4.0

数据集描述

该数据集是“Synset Signset Germany”数据集的GTSRB子集,专门用于德国的交通标志识别任务。它包含了与著名的GTSRB数据集完全相同的43个交通标志类别,因此可视为其“合成孪生”版本。每个类别包含500张图像,总计21,500张图像。

相关资源

  • 官方网站: https://synset.de/datasets/synset-signset-ger/
  • 原始论文: Sielemann, A., Loercher, L., Schumacher, M. L., Wolf, S., Roschani, M., Ziehn, J. and Beyerer, J. (2024). Synset Signset Germany: a Synthetic Dataset for German Traffic Sign Recognition. In 2024 IEEE International Conference on Robotics and Automation (ICRA).
  • 论文arXiv链接: https://arxiv.org/abs/2512.05936
  • 参考数据集: https://ieeexplore.ieee.org/abstract/document/6033395

作者与机构

作者: Anne Sielemann, Lena Lörcher, Max-Lion Schumacher, Stefan Wolf, Masoud Roschani, Jens Ziehn, Juergen Beyerer 所属机构: 德国弗劳恩霍夫IOSB研究所和弗劳恩霍夫IPA研究所

资助信息

  • 弗劳恩霍夫内部项目,资助号:PREPARE 40-02702,属于ML4Safety项目
  • 德国联邦经济事务和气候行动部,在“新车辆和系统技术”计划内,作为AVEAS研究项目的一部分

引用格式

BibTeX:

@inproceedings{synset_signset_ger_sielemann_2024, title={{Synset Signset Germany: A Synthetic Dataset for German Traffic Sign Recognition}}, author={Sielemann, Anne and Loercher, Lena and Schumacher, Max-Lion and Wolf, Stefan and Roschani, Masoud and Ziehn, Jens and Beyerer, Juergen}, booktitle={2024 IEEE 27th International Conference on Intelligent Transportation Systems (ITSC)}, year={2024} }

APA: Sielemann, A., Loercher, L., Schumacher, M., Wolf, S., Roschani, M., Ziehn, J., and Beyerer, J. (2024). Synset Signset Germany: A Synthetic Dataset for German Traffic Sign Recognition. In 2024 IEEE 27th International Conference on Intelligent Transportation Systems (ITSC).

使用建议与限制

建议该数据集主要用于科学研究。若应用于实际现实世界用例,应包含人工监督,并详尽评估其对特定目的的适用性,包括领域偏移的影响。

联系方式

Anne Sielemann

  • 机构:Fraunhofer IOSB
  • 部门:Automotive and Simulation
  • 地址:Fraunhoferstr., 76131 Karlsruhe, Germany
  • 邮箱:anne.sielemann@iosb.fraunhofer.de
  • 网站:https://www.iosb.fraunhofer.de

Jens Ziehn

  • 机构:Fraunhofer IOSB
  • 职位:Group leader »Automotive and Simulation«
  • 地址:Fraunhoferstr., 76131 Karlsruhe, Germany
  • 电话:+49 721 6091 – 633
  • 邮箱:jens.ziehn@iosb.fraunhofer.de
  • 网站:https://www.iosb.fraunhofer.de
搜集汇总
数据集介绍
构建方式
在交通标志识别领域,合成数据集的构建为算法训练提供了可控且多样化的环境。Synset-Signset-Germany-GTSRB-Subset数据集作为GTSRB数据集的合成孪生版本,其构建过程采用了先进的计算机图形学技术,通过程序化生成方式创建了涵盖德国43类交通标志的图像集合。每一类别均包含500张图像,总计21,500张,确保了数据分布的均衡性。生成过程中模拟了真实世界的光照、天气及视角变化,同时避免了真实数据采集可能涉及的隐私与标注成本问题,为研究提供了高质量的基准数据源。
使用方法
研究人员可将该数据集直接应用于图像分类与分割任务的模型训练与评估。使用前需从指定网站获取数据,并参照原始GTSRB的标注格式进行处理。鉴于其合成属性,建议在科学研究中用于验证算法在受控条件下的性能,或作为真实数据训练的补充以增强模型泛化能力。在实际部署前,应结合真实场景数据评估域偏移影响,并辅以人工监督确保应用可靠性。相关论文提供了基准方法与实验结果,可供后续研究参考。
背景与挑战
背景概述
Synset-Signset-Germany-GTSRB-Subset数据集由德国弗劳恩霍夫协会IOSB和IPA研究所的研究团队于2024年创建,旨在为德国交通标志识别任务提供高质量的合成数据资源。该数据集作为经典GTSRB数据集的“合成孪生”版本,涵盖了相同的43类交通标志,每类包含500张图像,总计21,500张。其核心研究问题聚焦于利用合成数据克服真实世界数据采集的局限性,推动自动驾驶与智能交通系统中视觉感知模型的稳健性发展。该数据集的发布为领域内算法验证与泛化能力评估提供了标准化基准,显著促进了合成数据在安全关键场景中的应用研究。
当前挑战
在交通标志识别领域,模型需应对复杂环境下的光照变化、遮挡、天气干扰及类别间细微差异等挑战,而真实数据往往难以全面覆盖这些场景。Synset-Signset-Germany-GTSRB-Subset通过合成数据生成试图缓解此类问题,但其构建过程亦面临独特挑战:一是需确保合成图像在纹理、几何与物理属性上与真实标志高度一致,以避免域偏移导致的性能下降;二是生成数据需在多样性与真实性之间取得平衡,以模拟现实世界中的自然变异;三是数据标注的精确性与一致性要求极高,任何偏差都可能影响模型训练的可靠性。
常用场景
经典使用场景
在智能交通系统与自动驾驶研究领域,合成数据集的构建对于克服真实世界数据采集的局限至关重要。Synset-Signset-Germany-GTSRB-Subset作为德国交通标志识别数据集GTSRB的合成孪生版本,其经典使用场景集中于为机器学习模型提供大规模、高质量的训练数据。研究者可利用该数据集中的21,500张合成图像,涵盖43类德国交通标志,以训练和验证图像分类与分割算法,尤其在模拟环境中评估模型对各类标志的识别鲁棒性。
解决学术问题
该数据集有效解决了交通标志识别研究中真实数据稀缺、标注成本高昂以及隐私安全约束等常见学术问题。通过提供与GTSRB类别完全对齐的合成数据,它使学者能够深入探究域适应、合成到真实迁移学习以及模型在可控合成环境中的泛化性能。其意义在于为学术界提供了一个标准化、可复现的基准平台,推动了合成数据生成技术与自动驾驶感知系统安全评估方法的前沿进展。
实际应用
在实际应用层面,Synset-Signset-Germany-GTSRB-Subset为自动驾驶汽车与高级驾驶辅助系统的开发提供了关键支持。工程团队可借助该数据集预训练感知模型,加速系统在真实德国道路场景中的部署。同时,它也被用于测试和验证车载摄像头系统在不同光照、天气及遮挡条件下对交通标志的识别可靠性,从而提升驾驶安全性与系统合规性,为智能交通基础设施的数字化升级奠定数据基础。
数据集最近研究
最新研究方向
在自动驾驶与智能交通系统领域,合成数据生成技术正成为解决真实数据稀缺与标注成本高昂的关键途径。Synset-Signset-Germany-GTSRB-Subset作为德国交通标志识别任务的合成数据集,其最新研究方向聚焦于利用生成式人工智能技术,构建高保真、多样化的虚拟场景,以模拟复杂天气条件、光照变化及视角差异下的交通标志形态。该数据集与GTSRB形成“合成孪生”关系,旨在通过可控的合成数据增强模型在现实世界中的泛化能力与鲁棒性,尤其应对域适应与零样本学习等前沿挑战。相关研究已深入探索合成数据与真实数据间的语义一致性优化,以及其在提升自动驾驶感知系统安全性与可靠性方面的潜在影响,为下一代交通标志识别算法的开发提供了重要基准与验证平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作