five

ClearLines

收藏
arXiv2025-05-01 更新2025-05-03 收录
下载链接:
https://gitlab.com/intelligent-transportation-systems/pdrive/clearlines_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ClearLines数据集是一个专门为边缘段检测而设计的小型数据集,用于评估相机校准质量。数据集来源于KITTI和IAMCV数据集,包含了从这些数据集中提取的85张KITTI图像、50张IAMCV市中心的图像和21张IAMCV乡村/环岛的图像。这些图像被用于训练和评估直线边缘段检测算法。数据集的创建过程中采用了边缘段检测流程,并对检测到的边缘段进行了手动筛选,以确保它们对应于3D空间中的直线。ClearLines数据集旨在解决智能交通系统、自动驾驶汽车和编队行驶等领域中相机校准的问题,并提高视觉SLAM、定位和地图对齐等下游任务的准确性。

The ClearLines dataset is a small, specialized dataset designed for edge segment detection and camera calibration quality evaluation. It is sourced from the KITTI and IAMCV datasets, comprising 85 KITTI images, 50 urban images from IAMCV, and 21 rural/roundabout images from IAMCV extracted from these two datasets. These images are employed for training and evaluating straight edge segment detection algorithms. During its development, an edge segment detection pipeline was utilized, and the detected edge segments were manually screened to confirm that they correspond to straight lines in 3D space. The ClearLines dataset aims to tackle camera calibration challenges in fields such as intelligent transportation systems, autonomous vehicles, and vehicle platooning, while improving the accuracy of downstream tasks including visual SLAM, localization, and map alignment.
提供机构:
奥地利林茨约翰尼斯开普勒大学智能交通系统系和德国柏林智能系统功能部IAV GmbH
创建时间:
2025-05-01
原始信息汇总

ClearLines数据集概述

数据集基本信息

  • 项目名称: ClearLines Dataset
  • 项目ID: 66563845
  • 创建日期: January 27, 2025
  • 项目地址: https://gitlab.com/intelligent-transportation-systems/pdrive/clearlines_dataset
  • 代码仓库: https://github.com/gregory-schroeder/clearlines_dataset.git

数据集简介

ClearLines是一个专为真实世界户外场景中的相机内参标定任务设计的数据集。该数据集专注于边缘段检测,并包含标记的直线边缘段,为评估和改进标定算法(特别是畸变参数估计)提供了基础。

数据集内容

  • 数据来源: KITTI和IAMCV
  • 主要包含:
    • 原始图像
    • 手动标注的直线边缘段标签

数据集结构

dataset/ ├── images/ # 原始图像 ├── labels/ # 手动和流水线生成的标签

评估工具

  • 评估脚本: evaluate.py
  • 评估指标:
    • 精确度(Precision)
    • 召回率(Recall)
    • F1分数(F1-Score)
    • 细粒度指标:
      • 交并比(IoU)
      • 平均旋转误差
      • 平均平移误差

评估输出

evaluation/ ├── summary.txt # 总体指标: 精确度、召回率、F1分数 ├── individual_results/ # 每张图像的详细指标 └── visualization/ # 真实标签与检测结果的视觉对比

引用信息

如果使用ClearLines数据集,请引用: bibtex @article{schroeder2025clearlines, title={ClearLines - Camera Calibration from Straight Lines}, author={Gregory Schroeder and Mohamed Sabry and Cristina Olaverri-Monreal}, journal={2025 IEEE Intelligent Vehicles Symposium (IV)}, year={2025} }

获取方式

  1. 安装Git LFS:

    git lfs install

  2. 克隆仓库:

    git clone https://github.com/gregory-schroeder/clearlines_dataset.git

  3. 安装依赖:

    pip install -r requirements.txt

搜集汇总
数据集介绍
main_image_url
构建方式
ClearLines数据集的构建过程融合了多源数据采集与精细标注策略,主要从KITTI和IAMCV两大自动驾驶领域经典数据集中精选了156幅真实道路场景图像(85幅城市道路、50幅市区复杂环境及21幅乡村/环岛场景)。构建流程采用级联式处理框架:首先通过优化边缘检测算法(改进Canny算子结合亚像素优化)实现高召回率的预标注,随后经人工校验剔除不符合3D直线投影特征的伪边缘片段。特别设计了最小100像素的长度阈值以保证校准可靠性,并创新性地采用圆拟合算法解决3D直线在图像中的断裂问题。数据集构建过程充分考虑了室外场景的光照变化、复杂遮挡等现实挑战,为直线基相机校准提供了首个专用基准。
特点
该数据集的核心价值体现在三个方面:场景多样性方面,涵盖城市、乡村、环岛等多类道路环境,包含不同光照和天气条件下的图像;标注精确性方面,通过亚像素级边缘定位和人工复核确保每个直线边缘段对应真实3D直线投影;任务针对性方面,专门优化了传统边缘检测指标(如采用F-score评估),重点关注意义边缘段的连续性而非普通边缘像素的检出率。数据集中每个样本均包含原始图像、算法预标注结果和人工精校标签三重信息,并配套可视化评估工具,能直观展示真阳性、假阳性及漏检案例。
使用方法
使用ClearLines数据集时建议遵循标准化流程:预处理阶段推荐采用CLAHE算法进行光照归一化;边缘检测需分离处理水平/垂直方向边缘以避免误连接;评估环节应重点关注长连续边缘段的检出质量而非传统边缘像素数量。配套工具包提供PR曲线量化分析功能,支持可视化标注比对。对于算法开发,建议优先优化边缘链式连接和断裂片段合并模块,可参考数据集提供的Taubin圆拟合方法。该数据集特别适合验证基于直线特征的在线校准算法在复杂室外场景的鲁棒性,但需注意其样本量(156幅)更适合模型验证而非深度学习训练。
背景与挑战
背景概述
ClearLines数据集由Gregory Schroeder、Mohamed Sabry和Cristina Olaverri-Monreal等研究人员于2025年提出,旨在解决几何计算机视觉中基于直线进行相机校准的实际应用问题。该数据集主要来源于KITTI和IAMCV数据集,包含城市、乡村及环形交叉路口等多种真实户外场景的图像。其核心研究问题在于如何从复杂且杂乱的户外环境中准确检测出与3D直线对应的边缘段,以用于相机内参校准。ClearLines填补了该领域专用数据集的空白,为视觉SLAM、定位和地图对齐等下游任务提供了重要支持。
当前挑战
ClearLines数据集面临的挑战主要包括两方面:领域问题的挑战与构建过程的挑战。在领域问题方面,户外场景中的光照变化、场景多样性以及3D直线投影的中断性使得准确检测直线边缘段变得极为困难。此外,现有的边缘检测算法往往无法区分真实3D直线对应的边缘段与误检段。在构建过程中,手动标注数百个亚像素精度的边缘点极为耗时,且需要高效的预处理流程来减少误检。数据集的规模较小也限制了其在深度学习模型训练中的应用,未来需通过合成数据扩展规模。
常用场景
经典使用场景
ClearLines数据集专为基于直线特征的相机标定研究而设计,其经典使用场景集中在复杂户外环境下的边缘段检测与标定算法验证。该数据集通过整合KITTI和IAMCV两大自动驾驶领域权威数据源的图像样本,为研究者提供了包含城市道路、乡村环境及环形交叉口等多场景的基准数据。尤其在处理光照变化、场景杂乱和3D直线投影中断等挑战时,该数据集能够有效评估算法在真实世界条件下的鲁棒性,弥补了传统标定方法依赖人工控制场景的局限性。
实际应用
在实际应用层面,ClearLines数据集直接服务于智能交通系统和自动驾驶的关键技术开发。其标定结果可提升视觉SLAM系统的定位精度,减少因畸变补偿不足导致的轨迹漂移;同时为车联网环境下的多传感器标定提供参考,特别是在GPS信号受限的城区场景中,基于道路基础设施直线特征的在线标定显示出独特优势。数据集配套的评估脚本还能快速验证各类边缘检测算法在真实驾驶场景的适用性,加速ADAS系统的迭代开发。
衍生相关工作
该数据集已衍生出多个研究方向:在方法论层面,推动了基于Taubin圆拟合的断裂线段融合技术发展,相关改进被应用于车载全景相机的标定;在数据生成领域,启发了合成数据与真实数据结合的混合标定方案,如Bogdan等人利用虚拟相机生成的扩充数据集;在评估体系方面,其采用的MSAC(M-estimator SAmple Consensus)框架成为处理户外标定异常值的新标准。此外,数据集揭示的透镜畸变模型局限性直接促发了如Schops等人提出的高参数化相机模型研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作