CarDD Dataset

github2025-04-10 更新2025-04-09 收录

下载链接：

https://github.com/harpreetsahota204/car_dd_dataset_workshop

下载链接

链接失效反馈

官方服务：

资源简介：

CarDD是一个新颖的、公开的大规模数据集，专门为基于视觉的汽车损伤检测和分割设计。该数据集包含4000张高分辨率汽车损伤图像，带有超过9000个精心标注的实例，是同类中最大的公开数据集。图像的高分辨率（平均684,231像素）是相对于现有数据集（平均50,334像素）的一个关键优势。更高分辨率允许更详细的标注和检测更细微损伤的潜力。

CarDD is a novel, publicly available large-scale dataset specifically designed for vision-based vehicle damage detection and segmentation. It contains 4,000 high-resolution images of vehicle damages, with over 9,000 meticulously annotated instances, making it the largest public dataset of its kind. The average resolution of the images is 684,231 pixels, which represents a key advantage over existing datasets that have an average resolution of only 50,334 pixels. The higher resolution enables more detailed annotation and the potential to detect finer-grained damages.

创建时间：

2025-04-07

原始信息汇总

CarDD数据集概述

基本信息

数据集名称：CarDD (Car Damage Detection)
数据规模：4,000张高分辨率汽车损伤图像，包含9,000+标注实例
图像分辨率：平均684,231像素
公开性：公开数据集（需遵守Flickr和Shutterstock许可条款）
用途限制：非商业研究和教育用途

损伤类别

包含6种常见外部汽车损伤类型：

Dent（凹痕）
Scratch（刮痕）
Crack（裂纹）
Glass shatter（玻璃破碎）
Tire flat（轮胎漏气）
Lamp broken（车灯损坏）

标注信息

标注标准：基于保险理赔标准的专业标注
标注内容：
- 对象检测/实例分割：掩膜和边界框（COCO格式）
- 显著对象检测(SOD)：像素级二元地面实况图
标注特征：
- 每个实例具有唯一ID、类别信息、掩膜轮廓和边界框坐标
- 处理了混合损伤、跨组件损伤和相邻同类损伤等复杂情况

数据集划分

训练集：70.4%
验证集：20.25%
测试集：9.35%
特点：保持各类别实例比例一致，去除近重复图像

适用任务

分类（损伤类型识别）
对象检测（损伤区域定位）
实例分割（像素级损伤区域划分）
显著对象检测（通过二元图识别损伤区域）

技术挑战

损伤类型间的细粒度区分（如凹痕与刮痕）
损伤对象尺度和形状的多样性
小对象占比高（尤其是凹痕、刮痕和裂纹）
损伤类型的视觉相似性和交织性（如凹痕、刮痕和裂纹）

获取方式

官方网址：https://cardd-ustc.github.io
引用格式： bibtex @ARTICLE{CarDD, author={Wang, Xinkuang and Li, Wenjing and Wu, Zhongcheng}, journal={IEEE Transactions on Intelligent Transportation Systems}, title={CarDD: A New Dataset for Vision-Based Car Damage Detection}, year={2023}, volume={24}, number={7}, pages={7202-7214}, doi={10.1109/TITS.2023.3258480}}

搜集汇总

数据集介绍

构建方式

在汽车保险与智能交通系统交叉领域，CarDD数据集通过系统化采集流程构建而成。研究团队基于保险理赔统计数据筛选出六类高频外部车损类型，由专业保险评估师与训练有素的标注人员共同完成注释工作。采用684,231像素平均分辨率的高清图像，严格遵循COCO数据集格式进行实例标注，包含掩膜、边界框及唯一ID等要素，并通过去重处理确保数据独立性，最终形成训练集（70.4%）、验证集（20.25%）与测试集（9.35%）的科学划分。

使用方法

该数据集支持计算机视觉领域四大核心任务：基于ResNet等架构的车损多分类识别，采用Faster R-CNN进行损伤区域定位，通过Mask R-CNN实现像素级实例分割，以及运用U-Net完成显著区域检测。使用需注意三点规范：访问cardd-ustc.github.io获取数据前需签署Flickr与Shutterstock版权协议；严格遵循非商业研究用途限制；预处理阶段已对隐私信息（人脸、车牌）进行马赛克处理，直接加载COCO格式标注即可开展实验。研究引用建议采用IEEE Transactions期刊提供的标准文献格式。

背景与挑战

背景概述

CarDD数据集由Xinkuang Wang等人于2023年发布，是首个专注于汽车损伤检测与分割的大规模公开数据集。该数据集由中国科学院大学智能交通系统研究团队构建，旨在解决保险理赔和智能维修领域中车辆损伤自动化识别的核心问题。作为目前该领域规模最大的标注数据集，CarDD收录了4,000张高分辨率图像，包含超过9,000个精细标注实例，平均图像分辨率达到684,231像素，远超同类数据集50,334像素的平均水平。数据集涵盖六类常见外部损伤，其标注标准由保险行业专家参与制定，严格遵循理赔实务规范，为计算机视觉在智能交通和保险科技领域的应用提供了重要基准。

当前挑战

该数据集面临双重技术挑战：在应用层面，损伤类型的细粒度区分尤为困难，特别是凹陷、划痕和裂纹等视觉相似损伤的鉴别；多尺度目标检测问题显著，约37%的标注实例属于小目标范畴。在构建层面，混合型损伤的优先级标注规则制定极具挑战性，需平衡保险实务与视觉显著性之间的关系；相邻同类别损伤的边界划分要求标注者具备专业的汽车结构知识，团队为此开发了基于部件拆解的标注指南。此外，数据清洗过程中近重复图像的识别与剔除，以及遵守原始图像版权协议的非商业使用限制，均为数据集构建过程中的关键难点。

常用场景

经典使用场景

在智能交通系统和汽车保险领域，CarDD数据集为基于视觉的汽车损伤检测与分割提供了关键支持。该数据集通过高分辨率图像和精细标注，支持分类、目标检测、实例分割和显著目标检测等多种计算机视觉任务。其六种常见损伤类别（如凹痕、划痕、裂纹等）的标注标准源自保险理赔数据，使得模型能够在真实场景中准确识别和定位损伤。

解决学术问题

CarDD数据集解决了汽车损伤检测领域数据稀缺和标注不精细的问题。作为目前最大的公开数据集，其高分辨率图像和详实的标注为研究小目标检测、多类别损伤区分以及复杂损伤场景下的模型鲁棒性提供了重要基础。该数据集推动了细粒度视觉识别和损伤交叉分析的研究，为智能交通系统中的自动化损伤评估奠定了数据基础。

实际应用

在保险理赔自动化领域，CarDD数据集训练的模型可大幅提升损伤评估效率。其标注标准与保险行业规范一致，使得算法能够直接应用于定损流程。同时，该数据集也为4S店和维修厂的智能检测系统开发提供了基准，通过视觉技术快速识别损伤类型和程度，优化服务流程并减少人工误判。

数据集最近研究