BDD100K

Name: BDD100K
Creator: 加州大学伯克利分校
Published: 2020-04-08 17:25:06
License: 暂无描述

arXiv2020-04-08 更新2024-06-21 收录

下载链接：

https://bdd-data.berkeley.edu

下载链接

链接失效反馈

官方服务：

资源简介：

BDD100K是由加州大学伯克利分校创建的大规模驾驶视频数据集，包含10万个视频，覆盖多种地理、环境和天气条件。数据集通过众包方式收集，由数万名司机上传。BDD100K不仅包含高分辨率（720p）和高帧率（30fps）的图像，还包含GPS/IMU记录以保存驾驶轨迹。数据集分为训练、验证和测试集，用于评估自动驾驶中的图像识别算法。BDD100K支持多种复杂任务，如图像标记、车道检测、可行驶区域分割等，旨在解决自动驾驶中的视觉理解和多任务学习问题。

BDD100K is a large-scale driving video dataset developed by the University of California, Berkeley. It contains 100,000 videos covering diverse geographical, environmental and weather conditions. The dataset is collected through crowdsourcing, with contributions from tens of thousands of drivers. In addition to high-resolution (720p) and high-frame-rate (30fps) imagery, BDD100K also provides GPS/IMU recordings that capture driving trajectories. The dataset is partitioned into training, validation and test subsets, which are used to evaluate image recognition algorithms for autonomous driving applications. BDD100K supports a wide range of complex tasks including image annotation, lane detection, drivable area segmentation and more, with the goal of addressing visual understanding and multi-task learning challenges in autonomous driving.

提供机构：

加州大学伯克利分校

创建时间：

2018-05-12

搜集汇总

数据集介绍

构建方式

在自动驾驶视觉研究领域，构建具有广泛多样性的数据集对于推动算法进步至关重要。BDD100K数据集通过众包方式收集了来自数万名驾驶者上传的驾驶视频，确保了数据的地理、环境和天气多样性。该数据集包含10万个高清视频片段，每个视频时长为40秒，覆盖了城市街道、住宅区和高速公路等多种场景，并在不同天气条件和时间下录制。数据标注涵盖了图像标注、车道检测、可行驶区域分割、道路物体检测、语义分割、实例分割、多目标检测跟踪、多目标分割跟踪、域适应和模仿学习等十项任务，为异构多任务学习提供了全面的基准。

使用方法

BDD100K数据集为自动驾驶视觉研究提供了多任务学习的基准平台。研究者可以利用该数据集进行异构多任务学习，探索如何在一个模型中同时处理输出结构各异的任务，如从简单的物体检测到复杂的多目标跟踪。数据集已划分为训练集、验证集和测试集，便于模型训练和评估。通过结合不同任务的标注，例如使用物体检测数据提升实例分割性能，或利用车道标注增强语义分割效果，研究者可以设计更高效的训练策略。此外，数据集的多样性支持域适应研究，帮助模型在不同环境条件下保持稳定性能，推动自动驾驶视觉系统的实际应用。

背景与挑战

背景概述

在自动驾驶技术蓬勃发展的背景下，计算机视觉模型的训练与评估亟需大规模、多样化的真实驾驶场景数据。传统数据集如KITTI、Cityscapes在场景多样性、标注丰富度及地理分布上存在局限，难以支撑异构多任务学习的深入研究。为此，加州大学伯克利分校等机构的研究团队于2020年正式发布了BDD100K数据集，该数据集包含10万段驾驶视频，覆盖城市街道、高速公路、住宅区等多种场景，并囊括昼夜、雨雪等多样化天气条件。其核心研究目标在于构建一个支持图像标注、车道线检测、可行驶区域分割、目标检测与跟踪等十项异构任务的综合性基准，以推动自动驾驶视觉系统在复杂真实环境中的泛化能力与多任务协同学习研究，对领域内算法评估与模型创新产生了深远影响。

当前挑战

BDD100K数据集旨在系统性地解决自动驾驶视觉感知中的异构多任务学习挑战，其核心问题在于如何让单一模型协同处理输出结构各异、复杂度不同的多项任务，例如从像素级的语义分割到时序性的多目标跟踪。构建过程中的挑战主要体现在数据采集与标注层面：一方面，为确保地理、环境与天气的多样性，需通过众包方式从数万名驾驶员处收集视频，并处理不同区域交通规则与基础设施差异带来的标注一致性难题；另一方面，数据标注本身极具复杂性，实例分割、多目标跟踪与分割等任务需要大量精细的人工标注，而标注成本与规模之间的平衡，以及长尾分布下稀有类别（如火车、拖车）的充分覆盖，均为数据集构建带来了显著挑战。

常用场景

经典使用场景

在自动驾驶视觉感知领域，BDD100K数据集因其规模宏大与任务多样性，成为评估多任务学习算法的经典基准。该数据集涵盖了城市街道、高速公路及住宅区等多种驾驶场景，并包含不同天气与光照条件下的视频序列，为模型提供了丰富的环境多样性。研究者通常利用其10项标注任务，如目标检测、语义分割与多目标跟踪，来系统探索异构多任务学习框架的性能与泛化能力。

解决学术问题

BDD100K有效解决了自动驾驶研究中数据多样性不足与任务异构性带来的挑战。传统驾驶数据集往往局限于单一地理区域或有限的环境条件，导致模型容易过拟合特定场景。该数据集通过众包方式采集自多个城市，覆盖昼夜、雨雪等多种复杂条件，为研究域适应与模型鲁棒性提供了坚实基础。其异构任务设置推动了从同质多任务学习向复杂异构任务联合建模的范式转变，促进了跨任务知识迁移与资源分配策略的探索。

实际应用

在实际自动驾驶系统中，BDD100K为感知模块的端到端训练与验证提供了关键数据支持。其大规模视频序列与精细标注可用于训练车辆检测、车道线识别、可行驶区域分割等核心感知组件，提升系统在真实复杂环境中的可靠性。数据集包含的GPS/IMU轨迹数据进一步支持模仿学习研究，为决策规划模块提供人类驾驶行为示范。工业界常利用该数据集进行模型预训练与跨域测试，以降低实际部署中的性能衰减风险。

数据集最近研究