five

TSOD10K|交通目标检测数据集|风险分析数据集

收藏
arXiv2025-03-21 更新2025-03-25 收录
交通目标检测
风险分析
下载链接:
http://arxiv.org/abs/2503.16910v1
下载链接
链接失效反馈
资源简介:
TSOD10K是首个大规模的交通显著目标检测数据集,由湖南师范大学信息科学与工程学院、南开大学人工智能学院和湖南大学机器人学院共同创建。该数据集包含13753张车辆捕获的图像,并带有像素级的精确注释。TSOD10K覆盖了各种真实世界交通场景,包括城市交叉口、高速公路、乡村道路和停车场,涵盖了雨、雪、雾、晴、低光等不同的天气/光照组合。数据集旨在支持动态风险分层下游服务,特别编码了视觉显著性和隐含的风险语义。
提供机构:
湖南师范大学信息科学与工程学院, 南开大学人工智能学院, 湖南大学机器人学院
创建时间:
2025-03-21
AI搜集汇总
数据集介绍
main_image_url
构建方式
TSOD10K数据集的构建采用了多源视频帧提取与三重校验标注策略。研究团队从BDD100K、DADA-2000等五个驾驶视频数据集中以十帧间隔采样,并针对事故视频专门提取包含事故目标的1-3个关键帧。为确保标注质量,采用由5年以上驾龄的驾驶员初标、交通工程师交叉验证、模拟风险评估仲裁的三阶段工作流程。数据集最终包含13,753张涵盖城市交叉口、高速公路等多样化场景的图像,并按风险参数划分为常规、警戒、危机三个紧急等级。
特点
该数据集首创性地融合了视觉显著性与隐式风险语义,具有四个核心特征:1) 首个大规模交通显著目标检测专用数据集;2) 覆盖雾天、暴雪等极端天气及低照度场景;3) 包含行人、车辆等主要道路目标的动态风险分层标注;4) 通过驾驶注意力先验标注低对比度高风险目标。统计显示76.3%的危机场景集中于恶劣天气条件,且小目标占比达68.5%,凸显其挑战性。
使用方法
数据集采用标准化命名规则(如C_H_F_L_00001.jpg)区分紧急等级、目标类别等属性,并按8:2比例随机划分为训练集TSOD10K-TR与测试集TSOD10K-TE。研究者可通过加载像素级标注掩膜进行模型训练,建议结合双频视觉状态空间模块处理频率特征,并利用螺旋扫描机制增强方向感知。评估时推荐采用Fβ、Eξ等四项指标,特别注意危机等级与小目标的分项性能分析。
背景与挑战
背景概述
TSOD10K数据集由湖南师范大学和南开大学的研究团队于2025年提出,是首个专注于交通场景显著性目标检测的大规模基准数据集。该数据集包含13,753张真实交通场景图像,涵盖城市交叉口、高速公路、乡村道路等多种环境,并特别考虑了雾天、暴雪、低对比度和低光照等复杂条件。数据集创新性地融合了视觉显著性和语义风险双重标准,重新定义了自动驾驶和辅助驾驶系统中的显著性概念,为智能交通系统的安全感知研究奠定了重要基础。
当前挑战
TSOD10K面临的核心挑战体现在两个方面:领域问题层面,传统基于外观的方法难以处理安全关键目标与复杂背景间极低的光度对比(如雾中遮挡的行人);数据构建层面,需平衡视觉显著区域与语义关键区域的标注矛盾,并克服极端天气条件下目标标注的困难。此外,数据集的构建需要专业驾驶经验与计算机视觉知识的深度融合,以确保标注质量符合实际驾驶安全需求。
常用场景
经典使用场景
TSOD10K数据集在交通场景显著物体检测(TSOD)领域具有广泛的应用价值。该数据集通过结合语义(如碰撞风险)和视觉显著性,为自动驾驶和辅助驾驶系统提供了关键的基准数据。其多样化的交通场景覆盖了城市交叉口、高速公路、乡村道路和停车场等多种环境,同时在各种天气和光照条件下(如雨、雪、雾、晴天和低光)采集数据,为研究者在复杂环境中进行显著物体检测提供了丰富的实验素材。
衍生相关工作
TSOD10K数据集的发布推动了多项相关研究的发展。基于该数据集,研究者提出了Tramba模型,这是一种基于Mamba的架构,通过双频视觉状态空间(DFVSS)模块和螺旋扫描机制(Helix-SS2D)显著提升了交通显著性分析的性能。此外,TSOD10K还激发了多模态传感器融合和实时自动驾驶系统部署的研究,为智能交通领域的技术创新奠定了基础。
数据集最近研究
最新研究方向
交通显著目标检测(TSOD)作为智能交通系统的关键环节,近年来在自动驾驶与辅助驾驶领域引发广泛关注。TSOD10K数据集的建立突破了传统自然场景显著目标检测(NSI-SOD)的视觉显著性范式,通过融合语义风险(如碰撞概率)与视觉特征重新定义了交通场景的显著性标准。当前研究聚焦于三个前沿方向:一是基于Mamba架构的时空建模方法,如论文提出的Tramba模型通过双频视觉状态空间(DFVSS)模块实现高频细节与低频结构的协同感知;二是驾驶注意力先验的嵌入机制,采用螺旋扫描策略(Helix-SS2D)模拟驾驶员对关键区域的定向关注;三是多模态环境下的鲁棒性研究,针对雾霾、低光照等极端场景开发自适应特征解耦算法。该方向与特斯拉纯视觉方案、Waymo多传感器融合等技术热点形成呼应,其成果将显著提升复杂交通场景下的安全预警能力,为L4级自动驾驶系统的决策模块提供理论支撑。
相关研究论文
  • 1
    Salient Object Detection in Traffic Scene through the TSOD10K Dataset湖南师范大学信息科学与工程学院, 南开大学人工智能学院, 湖南大学机器人学院 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

TCIA: The Cancer Imaging Archive

TCIA: The Cancer Imaging Archive 是一个公开的癌症影像数据库,包含多种癌症类型的影像数据,如乳腺癌、肺癌、脑癌等。数据集还包括相关的临床数据和生物标记物信息,旨在支持癌症研究和临床应用。

www.cancerimagingarchive.net 收录

coins-dataset

一个按面额分类的欧元硬币图像数据集,数据结构适合使用Keras的`ImageDataGenerator.flow_from_directory()`方法读取。源图像采用A4大小的白色背景顶部拍摄,通过`extract.py`脚本进行后期处理,以隔离单个硬币并标准化大小,然后进行手动分类。

github 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

PU Dataset

德国帕德博恩大学(PU)轴承故障诊断数据集提供了丰富的轴承故障信号数据,包括内圈、外圈和滚动体故障等多种类型的轴承故障。与其他数据集相比,PU数据集的特色在于包含了大量的电机驱动系统故障数据,为轴承故障诊断研究提供了一个全面的实验平台。

github 收录