EpicZhang/ChineseTrafficRegulatorySignDataBase
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/EpicZhang/ChineseTrafficRegulatorySignDataBase
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-nc-sa-4.0
task_categories:
- object-detection
language:
- zh
- en
tags:
- ChineseTrafficSign
- YOLO
- Speed Limit
- Stop
- Road Closed
- No Entry
- Give Way
- Autonomous Driving
- Computer Vision
- Adverse Weather
pretty_name: 'CTRSDB: Chinese Traffic Regulatory Sign Database'
size_categories:
- 1K<n<10K
---
# CTRSDB: Chinese Traffic Regulatory Sign DataBase
## 数据集简介
CTRSDB是聚焦中国道路场景**限速、禁行、让行三类核心管制交通标志**的目标检测专用数据集,专为边缘端轻量级交通目标识别模型训练优化,覆盖阴天、雨雾、信号干扰等真实复杂道路场景,完美适配YOLO系列等主流检测模型。
## 核心亮点
1. 场景针对性强:聚焦自动驾驶、辅助驾驶最核心的管制类交通标志,无冗余类别,标注精度高
2. 恶劣场景适配:通过AI生成扩增了雨雾极端天气低能见度场景数据,提升模型在复杂天气下的鲁棒性
3. 开箱即用:原生支持YOLO格式标注,配套训练配置文件,clone后可直接用于模型训练
4. 合规开源:遵循CC BY-NC-SA 4.0协议,仅用于学术学习与非商用场景
## 数据集详情
|项目|详情|
|:--|:--|
|总图片数量|3960张|
|核心类别|限速、禁行通行、禁止驶入、减速让行、停车让行|
|标注格式|YOLO原生txt格式 |
|数据集划分|训练集:验证集:测试集=7:2:1|
## 数据集中英名对照
|类别|中文名称|英文名称|
|:--:|----|----|
|0|限速5公里/小时|Speed Limit 5km/h|
|1|限速15公里/小时|Speed Limit 15km/h|
|2|限速30公里/小时|Speed Limit 30km/h|
|3|限速40公里/小时|Speed Limit 40km/h|
|4|限速50公里/小时|Speed Limit 50km/h|
|5|限速60公里/小时|Speed Limit 60km/h|
|6|限速70公里/小时|Speed Limit 70km/h|
|7|限速80公里/小时|Speed Limit 80km/h|
|8|停车让行|Stop|
|9|禁止通行|Road Closed|
|10|禁止驶入|No Entry|
|11|减速让行|Give Way|
## 数据来源与合规说明
本数据集严格遵循开源协议规范,所有内容均合规可追溯:
1. 基础数据融合自以下公开数据集,使用完全遵循原数据集的开源协议:
- 【CTSDB】:[官方链接](https://cg.cs.tsinghua.edu.cn/ctsdb/),原生使用规则:仅限非商业学术研究使用,社区分发遵循 CC BY-NC-SA 4.0 协议
- 【CCTSDB】:[官方链接](https://github.com/csust7zhangjm/CCTSDB),原生使用规则:仅限非商业学术研究使用,引用需标注原论文,社区分发遵循 CC BY-NC-SA 4.0 协议
2. 新增自主采集:重点补充采集了禁止通行这一细分种类数据集
3. 数据扩增处理:实施AI雨雾效果、亮度扰动、模拟信号干扰等数据扩增手段,扩充训练样本的多样性。
## 使用方法
```python
# Hugging Face datasets库直接加载
from datasets import load_dataset
dataset = load_dataset("EpicZhang/ChineseTrafficRegulatorySignDataBase")
提供机构:
EpicZhang
搜集汇总
数据集介绍

构建方式
CTRSDB数据集以中国道路场景中核心的管制类交通标志为采集目标,融合自清华大学CTSDB与CCTSDB两个公开数据集,并补充自主采集的禁止通行标志图像,确保类别覆盖的完整性。在此基础上,通过AI技术对原始图像施加雨雾效果、亮度扰动与模拟信号干扰等数据扩增手段,显著提升了训练样本在恶劣天气与复杂光照条件下的多样性。最终整合为包含3960张图片的专用数据集,按照7:2:1的比例划分为训练集、验证集与测试集,适配边缘端轻量级模型训练需求。
特点
该数据集聚焦于自动驾驶与辅助驾驶场景下最具实际意义的限速、禁行、让行三类交通标志,共包含12个细分类别,去除冗余类别以提升标注精度。其核心优势在于通过针对性数据扩增增强了模型在雨雾、阴天等低能见度恶劣环境下的鲁棒性。数据集原生支持YOLO格式的标注文件,并配套完整训练配置文件,可实现开箱即用的高效训练体验。此外,数据集遵循CC BY-NC-SA 4.0协议合规开源,专为学术研究与教学场景设计。
使用方法
使用该数据集时,可通过Hugging Face的datasets库直接加载,仅需一行代码即可完成数据集获取。数据集标注文件采用YOLO原生txt格式,用户可无缝衔接YOLOv5、YOLOv8等主流目标检测框架进行模型训练与评估。与开源社区中其他交通标志数据集相比,CTRSDB剔除了警告与指示类标志的干扰,使模型专注学习核心管制标志的特征表达。建议研究者在训练前参考配套配置文件进行超参数设置,以充分发挥数据集中雨雾场景与信号干扰样本的增强效果。
背景与挑战
背景概述
ChineseTrafficRegulatorySignDataBase(简称CTRSDB)是由研究团队于近年创建的中国道路场景管制交通标志目标检测专用数据集,旨在推动自动驾驶与辅助驾驶系统在复杂环境下的视觉感知能力。该数据集聚焦限速、禁行、让行等核心管制类标志,涵盖5至80公里/小时的多级限速类别以及停车让行、禁止通行等关键标志,融合了清华大学CTSDB与CCTSDB等公开数据的合规子集,并补充了自主采集的禁止通行样本。通过AI生成扩增雨雾、亮度扰动及信号干扰等恶劣场景数据,CTRSDB提升了模型在低能见度与不良天气下的鲁棒性。其原生支持YOLO格式标注,共3960张图片,划分为7:2:1的训练-验证-测试比例,为轻量化边缘端交通标志识别研究提供了高质量基准,对提升中国道路环境下的智能驾驶安全性具有显著贡献。
当前挑战
CTRSDB数据集所应对的核心领域挑战在于自动驾驶系统对管制交通标志的实时精准识别,尤其在阴天、雨雾及信号干扰等复杂条件下,传统模型易出现漏检与误判,直接影响行车决策的可靠性。构建过程中,研究人员面临多重困难:首先,原始数据源(CTSDB与CCTSDB)的类别分布不均,部分标志样本稀缺,需通过自主采集与合规扩展以平衡类别;其次,为模拟真实恶劣环境,必须设计精细的AI扩增策略(如雨雾效果、亮度扰动),以避免过度失真导致模型泛化能力下降;最后,在遵循CC BY-NC-SA 4.0协议下整合多源数据时,需确保版权合规与标注一致性,同时优化YOLO格式以满足边缘端低算力部署需求,这些步骤均对数据质量与实用性提出了严苛要求。
常用场景
经典使用场景
在自动驾驶与高级辅助驾驶系统的研发进程中,交通标志的精准识别是确保行车安全与合规的关键环节。CTRSDB数据集聚焦于中国道路场景中最具代表性的限速、禁行与让行三大类管制标志,涵盖从5km/h至80km/h的多种限速值、停车让行、禁止通行、禁止驶入及减速让行共12个细分类别。该数据集包含3960张高质量图像,并精心划分为训练集、验证集与测试集(比例为7:2:1),原生支持YOLO格式标注,可直接用于目标检测模型的训练与评估。其经典应用场景包括:在边缘计算设备上部署轻量级交通标志识别模型、验证模型在阴天、雨雾及信号干扰等异常环境下的鲁棒性,以及作为基准数据集对比不同检测算法的性能优劣。
实际应用
在实际工程落地层面,CTRSDB的数据特性与标注格式使其能够无缝对接主流的YOLO系列检测框架,显著降低了研发过程中的数据预处理成本。该数据集可直接用于训练车载嵌入式视觉系统,实现实时的限速预警、禁行区域识别及让行标志提醒等功能,提升驾驶辅助系统的安全性与智能化水平。在智能交通基础设施中,基于该数据集训练的模型可用于路侧感知单元,对违规进入禁行区域或未按规定让行的车辆进行抓拍与告警。此外,针对雨雾天气的专项增强数据使模型能够适应中国南方多雨或北方雾霾等复杂气候条件,增强了产品在不同地域部署的可靠性。其轻量化设计也使其适用于无人机巡检、港口无人驾驶等对计算资源敏感的工业场景。
衍生相关工作
CTRSDB的构建理念与数据特性已催生多个方向的相关研究工作。在数据层面,其融合CTSDB与CCTSDB并自主补充采集的范式,为后续研究者提供了可借鉴的多源数据整合与类别平衡策略。在算法层面,研究者可基于该数据集开发面向恶劣天气的域适应方法、小样本学习框架或在YOLO基础上进行注意力机制改进,以提升雨雾场景下小目标交通标志的检测精度。此外,由于数据集覆盖了不同限速值的连续数值类,这激发了关于回归式检测头与分类式检测头在速度标志识别任务中的对比研究。数据集的原生YOLO格式也推动了端到端模型部署方案(如TensorRT、OpenVINO)的优化验证工作,以及模型剪枝与量化技术在交通标志识别任务上的性能评估。
以上内容由遇见数据集搜集并总结生成



