FSOCO数据集

Name: FSOCO数据集
Creator: 苏黎世联邦理工学院
Published: 2022-01-31 19:22:59
License: 暂无描述

arXiv2022-01-31 更新2024-07-24 收录

下载链接：

https://www.fsoco-dataset.com/

下载链接

链接失效反馈

官方服务：

资源简介：

FSOCO数据集是由苏黎世联邦理工学院等机构合作创建的，专为Formula Student Driverless竞赛中的视觉基础锥体检测系统设计。该数据集包含人工标注的边界框和实例级分割掩码，通过要求学生团队先贡献数据再获取访问权限的方式，确保数据集的持续增长。数据集通过提供清晰的标注指南和工具，保证新标注的质量。FSOCO数据集主要用于解决自动驾驶车辆在特定赛道上的视觉场景理解和物体检测问题，特别是在没有预设地图的情况下导航赛道的需求。

The FSOCO dataset was collaboratively developed by institutions including ETH Zurich and other partner organizations, and is specifically tailored for vision-based cone detection systems in the Formula Student Driverless competition. It contains manually annotated bounding boxes and instance-level segmentation masks, and ensures sustained growth by requiring student teams to contribute data before gaining access to the dataset. The dataset guarantees the quality of newly added annotations by providing clear annotation guidelines and supporting tools. Primarily, the FSOCO dataset is designed to address challenges in visual scene understanding and object detection for autonomous vehicles on dedicated race tracks, particularly the requirement of navigating such tracks without pre-built maps.

提供机构：

苏黎世联邦理工学院

创建时间：

2020-12-14

搜集汇总

数据集介绍

构建方式

在无人驾驶赛车领域，视觉感知是环境理解的核心，而锥桶检测则是赛道导航的关键。FSOCO数据集专为Formula Student Driverless赛事中的锥桶检测任务而构建，其构建方式独具匠心。该数据集采用“数据买入”协作机制，要求参赛团队先贡献标注数据才能获得访问权限，从而确保数据集的持续增长。贡献流程包括通过标注考试、利用预标注工具优化标签质量，并经过自动化检查与专家迭代审核。数据来源必须包含至少50%的规则合规赛道实况影像，并通过基于AlexNet特征提取的余弦相似度评分筛选，剔除冗余图像，保障数据多样性与代表性。最终，数据集包含人工标注的边界框和实例级分割掩码，涵盖蓝、黄、小橙、大橙及辅助类共五类锥桶，并支持三种对象标签（倾倒、截断、外观改变）。

特点

FSOCO数据集在自动驾驶锥桶检测领域展现出显著特点。其核心优势在于高质量与协作性：通过严格的标注指南和自动化预标注机制，标签一致性远超其前身FSOCO legacy；协作模式不仅鼓励团队贡献，还允许捐赠原始数据供他人标注，形成社区驱动的良性循环。数据集覆盖多种光照与天气条件，如晴天、阴天、黄昏及降雨，并包含复杂场景如阴影和水滴遮挡。统计显示，图像中锥桶数量差异大且多为小目标，这对检测算法构成挑战。与遗留版本相比，FSOCO虽规模较小（仅3821张图像），但每张图像锥桶密度更高（平均17.77个），且通过相似度评估有效减少了冗余，使得训练得到的YOLOv4模型在精度上显著优于旧版。

使用方法

使用FSOCO数据集进行计算机视觉研究时，需遵循其特有的访问与使用规范。首先，团队需通过贡献数据或标注来获取训练集访问权限，具体流程包括通过在线标注考试并提交符合指南的标注。数据集采用Supervisely格式存储，并提供多种标签转换工具（如Darknet YOLO、Pascal VOC），便于集成至主流检测框架。用户可利用FSOCO Tools命令行界面进行数据可视化与预处理，例如裁剪图像边缘140像素的水印。训练时，推荐使用YOLOv4等单阶段检测器，并注意处理小目标与多类别不平衡问题。此外，部分贡献数据被保留为非公开测试集，可用于公平的性能评估。研究者还可通过官方网站获取最新统计数据与预训练模型，以复现论文中的基准实验。

背景与挑战

背景概述

在自动驾驶视觉感知领域，针对特定场景的高质量数据集是推动算法进步的关键基石。FSOCO（Formula Student Objects in Context）数据集由苏黎世联邦理工学院、慕尼黑大学及代根多夫应用技术大学的研究者于2022年联合发布，聚焦于大学生方程式无人驾驶（FSD）赛事中的锥桶检测任务。该数据集以协作共建为核心理念，采用“数据购买”机制，要求参赛团队先贡献标注数据方可获取访问权限，从而保障数据集的持续扩充与质量可控。FSOCO提供了边界框与实例分割掩码的双重标注，覆盖蓝色、黄色、大小橙色锥桶等五类目标，并包含多种光照与天气条件下的赛道影像。其独创的候选图像筛选流程与相似度评分工具显著提升了数据多样性，相较于前身版本，在减少冗余图像的同时实现了更优的检测精度，为FSD领域的感知系统研究提供了标准化基准。

当前挑战

FSOCO数据集所面临的挑战首先体现在领域问题的复杂性上：FSD赛道上的锥桶检测需在极端光照（如日落过曝、雨滴水渍遮挡）、小目标密集分布及动态阴影等恶劣条件下实现高精度定位与分类，这对模型的鲁棒性与泛化能力提出了严苛要求。其次，构建过程中的挑战尤为突出：早期FSOCO legacy版本因缺乏统一标注规范与原始数据筛选标准，导致大量高度相似或低质量图像混入，需耗费大量人工进行预处理；同时，各参赛团队传感器配置各异、测试场地有限，使得数据分布存在场景偏差。此外，为确保标注一致性，团队需通过严格的标注考试与迭代审核流程，但人工标注成本高昂，且预标注模型的输出仍需人工修正以应对分布外数据，进一步增加了数据构建的难度与时间开销。

常用场景

经典使用场景

在无人驾驶赛车领域，视觉感知系统的核心任务之一是对赛道边界标志物——锥桶进行精确检测与定位。FSOCO数据集专为Formula Student Driverless（FSD）竞赛设计，提供了包含边界框与实例级分割掩码的高质量标注图像。其经典使用场景集中于训练和评估基于深度学习的锥桶检测模型，尤其是在单目或立体RGB摄像头配置下，利用YOLOv4等单阶段检测器实现实时、鲁棒的锥桶识别。数据集覆盖了多种光照（如晴天、阴天、黄昏）与天气（如降雨）条件，以及锥桶的倒伏、截断等特殊状态，从而支持模型在复杂动态赛道环境中的泛化能力。通过严格的贡献筛选与相似度评分机制，FSOCO确保了训练数据的多样性与低冗余性，为FSD赛车在未知赛道上的自主导航提供了可靠的感知基础。

衍生相关工作

FSOCO数据集催生了一系列衍生研究工作，推动了FSD领域感知技术的发展。其直接基线实验采用YOLOv4进行边界框回归，验证了数据质量对检测精度的提升——在更少图像（仅为旧版FSOCO legacy的7.5%）的情况下，平均精度显著优于旧版。这一结果激励了后续工作探索更高效的轻量级检测网络（如YOLOv5、YOLOv8）在FSD场景中的适配。此外，数据集提供的实例分割掩码为基于像素的锥桶检测方法（如Mask R-CNN）提供了训练基础，有望打破FSD社区此前仅依赖边界框的局限。在数据层面，FSOCO的贡献机制与图像相似度评分工具被其他竞赛数据集（如Roborace相关数据集）借鉴，成为协作式数据集构建的范例。未来，FSOCO计划扩展至3D点云标注，这将催生多模态融合感知的基准研究，进一步缩小仿真与真实赛道之间的差距。

数据集最近研究