VehicleSeg10K

Name: VehicleSeg10K
Creator: 安徽大学计算机科学与技术学院, 奇瑞汽车, 安徽大学人工智能学院
Published: 2025-08-06 17:46:49
License: 暂无描述

arXiv2025-08-06 更新2025-08-08 收录

下载链接：

https://github.com/Event-AHU/SAV

下载链接

链接失效反馈

官方服务：

资源简介：

VehicleSeg10K是一个大规模的车辆分割基准数据集，包含11,665张图像和13个车辆部件类别，收集自不同的场景和视角。这些图像经过精心标注和细化，以支持SAV框架的验证。该数据集分为训练和测试子集，分别包含8,596和3,069张图像。此外，还训练和评估了18个基准分割模型，以建立一个全面的基准。该数据集旨在为车辆部件分割研究提供一个坚实的基础。

VehicleSeg10K is a large-scale vehicle segmentation benchmark dataset that includes 11,665 images and 13 vehicle part categories, collected from various scenarios and perspectives. These images have been carefully annotated and refined to support the validation of the SAV framework. The dataset is divided into training and test subsets, containing 8,596 and 3,069 images respectively. In addition, 18 baseline segmentation models were trained and evaluated to establish a comprehensive benchmark. This dataset aims to provide a solid foundation for vehicle part segmentation research.

提供机构：

安徽大学计算机科学与技术学院, 奇瑞汽车, 安徽大学人工智能学院

创建时间：

2025-08-06

原始信息汇总

SAV数据集概述

基本信息

论文标题: Segment Any Vehicle: Semantic and Visual Context Driven SAM and A Benchmark
作者: Xiao Wang, Ziwen Wang, Wentao Wu, Anjie Wang, Jiashu Wu, Yantao Pan, Chenglong Li
论文链接: https://arxiv.org/abs/2508.04260
arXiv编号: 2508.04260
研究领域: 计算机视觉、自动驾驶、车辆部件分割

数据集描述

数据集名称: VehicleSeg10K
数据规模: 11,665个高质量像素级标注样本
特点:
- 覆盖多样化场景和视角
- 专门用于车辆部件分割任务
- 包含结构化语义标签

数据集下载

Baidu网盘:
- 链接: https://pan.baidu.com/s/1v0_VfTfzvdxqWw0TG4Ifsw?pwd=8bfb
- 提取码: 8bfb
Dropbox:
- https://www.dropbox.com/scl/fi/tgtdboa4pxa7rtfg9ag52/VehicleSeg10K.zip?rlkey=ex4ssmgb21agqyvg0rysbl9pv&st=o14a1fo3&dl=0

技术框架

核心组件:
1. SAM基础的编码器-解码器
2. 车辆部件知识图谱
3. 上下文样本检索编码模块
创新点:
- 通过结构化本体显式建模车辆部件间关系
- 利用视觉相似性检索增强分割性能

引用格式

bibtex @misc{wang2025SAV, title={Segment Any Vehicle: Semantic and Visual Context Driven SAM and A Benchmark}, author={Xiao Wang and Ziwen Wang and Wentao Wu and Anjie Wang and Jiashu Wu and Yantao Pan and Chenglong Li}, year={2025}, eprint={2508.04260}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2508.04260}, }

搜集汇总

数据集介绍

构建方式

VehicleSeg10K数据集的构建过程严格遵循大规模、多样性和细粒度三大原则。研究团队通过网络爬取技术采集了11,665张车辆图像，分辨率覆盖229×202至1411×1302像素范围，确保数据来源的真实性和多样性。在标注环节，采用专家监督下的多阶段质量控制机制，由专业团队对13类车辆部件（包括车窗、车门、车轮等）进行像素级精确标注，最终形成包含97,471个部件实例的高质量数据集。数据划分方面，8,596张图像用于训练，3,069张用于测试，充分满足模型开发与评估需求。

特点

该数据集具有三个显著特征：首先，场景覆盖全面，包含昼夜不同时段、雨雪雾等多种天气条件，以及俯视、平视等多角度视角，有效模拟真实道路环境。其次，车型多样性突出，涵盖轿车、SUV、MPV等6大类车型，且车辆颜色分布符合实际道路统计规律。最重要的是细粒度标注优势，针对车辆双侧对称结构的特点，对左右侧同名部件进行独立标注，为部件级语义理解提供精准监督信号。

使用方法

使用VehicleSeg10K时，建议采用端到端的部件分割框架进行处理。输入图像需保持原始分辨率以保留细节特征，针对小尺寸部件可设置32像素的面积过滤阈值。训练阶段推荐使用AdamW优化器，初始学习率设为0.0001，配合线性预热和阶梯式衰减策略。评估指标应采用mIoU和mAcc双重标准，其中mIoU侧重边界精度，mAcc关注分类准确性。对于实际部署，可结合论文提出的SAV框架，通过车辆部件知识图谱增强结构先验，利用视觉上下文样本提升分割一致性。

背景与挑战

背景概述

VehicleSeg10K数据集由安徽大学计算机科学与技术学院的研究团队于2025年创建，旨在解决自动驾驶领域中车辆部件细粒度分割的关键问题。该数据集包含11,665张高质量图像，覆盖13类车辆部件，涵盖多种车型、视角及复杂场景（如夜间和恶劣天气条件）。作为首个融合结构知识图谱与视觉上下文的大规模基准，其创新性地将Segment Anything Model (SAM)扩展至车辆部件分割领域，显著提升了语义分割精度。该数据集的发布填补了现有基准在真实场景多样性和部件级标注上的空白，为自动驾驶感知、智能交通管理等应用提供了重要支撑。

当前挑战

VehicleSeg10K面临的挑战主要体现在两方面：领域问题层面，车辆部件分割需克服部件间结构关系复杂（如相邻车窗与车门的空间约束）、视觉相似性高（如不同车型的轮毂差异）以及极端场景干扰（如雨雪天气下的部件边界模糊）等难题；构建过程层面，数据收集需平衡多车型/视角的覆盖率，像素级标注需处理部件遮挡与边缘精度问题，而知识图谱构建则需建模部件间的刚性空间关系（如车门与车窗的拓扑连接）。此外，将SAM适配至部件级任务需解决其缺乏语义标签、依赖显式提示等固有局限。

常用场景

经典使用场景

VehicleSeg10K数据集在自动驾驶和智能交通系统中具有广泛的应用场景，特别是在车辆部件的精细分割任务中。该数据集通过提供高质量的像素级标注，支持对车辆各个部件（如车轮、车窗、车门等）的精确识别和定位。其多样化的场景和视角覆盖，使得该数据集成为评估和提升车辆分割算法性能的理想选择。

解决学术问题

VehicleSeg10K数据集解决了车辆部件分割中的多个关键学术问题，包括复杂结构关系的建模、不同光照条件下的分割准确性以及多样化车辆外观的处理。通过引入知识图谱和上下文样本增强模块，该数据集显著提升了分割模型的语义理解能力和泛化性能，为精细分割任务提供了新的研究基准。

衍生相关工作

VehicleSeg10K数据集的发布推动了多个相关研究方向的进展，包括基于SAM的车辆分割模型、知识图谱在视觉任务中的应用以及上下文增强技术的开发。该数据集还催生了一系列经典工作，如SAV框架，该框架通过结合结构知识和视觉上下文，显著提升了车辆部件分割的准确性和效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集