BARS
收藏arXiv2022-07-17 更新2024-06-21 收录
下载链接:
https://openbenchmark.github.io/BARS
下载链接
链接失效反馈官方服务:
资源简介:
BARS数据集是由华为诺亚方舟实验室和清华大学联合创建的,旨在为推荐系统提供一个全面的基准测试平台。该数据集包含6个广泛使用的数据集,涵盖了匹配和排名任务,支持研究人员进行可重复的实验。BARS不仅提供了数据集和源代码,还包括超参数设置、运行日志和评估结果,以确保研究的可重复性和比较的公平性。该数据集的应用领域包括电子商务、社交媒体和新闻推荐等,旨在解决推荐系统中的性能评估和模型比较问题。
The BARS dataset was jointly developed by Huawei Noah's Ark Lab and Tsinghua University, aiming to provide a comprehensive benchmark platform for recommendation systems. It comprises six widely-used datasets, covering both matching and ranking tasks, to support researchers in conducting reproducible experiments. BARS not only provides datasets and source code, but also includes hyperparameter settings, execution logs, and evaluation results, so as to ensure the reproducibility of research and the fairness of comparative evaluations. Its application scenarios cover e-commerce, social media, news recommendation and other related fields, and it is designed to address the issues of performance evaluation and model comparison in recommendation systems.
提供机构:
华为诺亚方舟实验室
创建时间:
2022-05-19
搜集汇总
数据集介绍

构建方式
在航空飞行中,着陆阶段是事故风险最高的环节,而机场跑道分割技术能有效提升安全性。然而,该领域长期缺乏大规模公开数据集。为此,BARS数据集应运而生。其图像采集依托于经美国联邦航空管理局认证的X-Plane仿真平台,该平台涵盖了全球几乎所有机场的地形与真实场景。研究团队从不同机场、不同飞行视角、多种天气条件及时间区间中收集了10,256张图像,并经过清洗去重,确保数据质量。在标注方面,BARS精心选择了跑道、入口标志和瞄准标志三个类别,并设计了半自动标注流水线:通过逆透视变换将单张完整标注图像转换为世界坐标系下的矩形,计算三类标志间的比例关系;随后对同一跑道组内的其他图像仅需标注一个类别,即可利用该比例关系自动生成其余类别的标注,大幅降低了人工工作量。最终,BARS包含30,201个实例,并遵循MSCOCO格式,便于直接应用于现有实例分割方法。
特点
BARS数据集在机场跑道分割领域独具特色。首先,它是目前规模最大的公开数据集,拥有10,256张图像和30,201个实例,远超同类数据集。其次,BARS是唯一提供实例标注的数据集,且类别最为丰富,包含跑道、入口标志和瞄准标志三类关键标记,能够满足着陆阶段视觉导航的实用需求。此外,数据集覆盖了约15个国家、40个机场,场景多样性显著,图像在不同光照条件(高光、低光、黑暗)和多种天气下采集,模拟了飞机从500米高度至降落的完整着陆阶段,实例尺寸分布广泛,其中瞄准标志常为小目标,增加了分割挑战性。BARS还具备图像分辨率高(1920×1080像素)、公开可用等优点,填补了该领域数据缺失的空白。
使用方法
BARS数据集可直接用于训练和评估各类实例分割方法。使用时,将数据集划分为训练集(8,004张)、验证集(1,002张)和测试集(1,250张)。由于遵循MSCOCO格式,用户可轻松加载数据并应用Mask R-CNN、Mask2Former等掩码方法,或PolarMask、E2EC等轮廓方法。针对跑道规则形状的特点,论文还提出了即插即用的平滑后处理模块(SPM)和轮廓点约束损失函数(CPCL),分别用于优化掩码方法和轮廓方法的分割边界平滑度。此外,引入平均平滑度(AS)作为新评估指标,衡量分割结果的边界平滑程度。用户可通过官方GitHub仓库获取完整代码与数据集,复现论文中的基准实验,或基于此进行算法改进与应用开发。
背景与挑战
背景概述
机场跑道分割是视觉导航系统中的核心技术,旨在降低飞机着陆阶段的事故风险。然而,该领域长期缺乏大规模、公开可用的数据集,严重制约了基于深度学习的分割方法的发展。为此,上海大学与上海飞机设计研究院的研究团队于2022年提出了BARS(Airport Runway Segmentation Benchmark),该数据集利用X-Plane仿真平台采集了10,256张航空视角图像,包含跑道、阈值标志和瞄准标志三类共30,201个实例,并提供了唯一的实例标注。BARS是目前该领域规模最大、类别最丰富的数据集,填补了机场跑道分割数据集缺失的空白,为相关研究提供了标准化基准,推动了视觉导航系统在航空领域的实际应用。
当前挑战
BARS所应对的核心挑战包括:首先,现有数据集多源自遥感视角,无法满足飞机着陆阶段的实际需求,且规模小、类别单一、不公开,导致深度学习模型难以适配;其次,跑道标记具有规则形状,而现有实例分割方法主要针对不规则物体,在边界平滑度上表现欠佳。在构建过程中,团队面临图像采集困难,需借助仿真平台模拟多种天气与光照条件,并设计半自动标注流程以降低人工标注负担。此外,小目标(如瞄准标记)的分割精度与边界平滑性之间的权衡仍是技术难点,现有评估指标对规则物体边界的敏感度不足,亟需新的平滑度度量方法。
常用场景
经典使用场景
在航空视觉导航领域,跑道分割是保障飞机着陆阶段安全的关键技术。BARS数据集作为目前规模最大、类别最丰富且唯一提供实例标注的机场跑道分割基准,为深度学习驱动的实例分割方法提供了标准化的训练与评估平台。其经典使用场景聚焦于从飞行器视角的航拍图像中,精确分割出跑道、阈值标志和瞄准标志三类关键语义区域,尤其适用于多跑道复杂场景下的像素级分类与实例区分。
解决学术问题
该数据集有效填补了机场跑道分割领域缺乏大规模公开数据集的空白,解决了传统方法依赖手工特征、泛化能力弱且难以适应复杂光照与天气条件的问题。通过提供多样化的机场场景、不同时间与天气下的图像,BARS支撑了实例分割方法在规则形状物体上的性能评估,并推动了边界平滑度这一被IoU指标忽视的学术评价维度的研究。
衍生相关工作
基于BARS数据集,研究者提出了平滑后处理模块(SPM)和轮廓点约束损失函数(CPCL),分别针对基于掩膜和基于轮廓的实例分割方法优化规则形状物体的边界平滑性。此外,还设计了平均平滑度(AS)评估指标,弥补了传统指标对边界质量不敏感的缺陷。这些工作为规则物体分割任务提供了可借鉴的改进范式,并催生了更多关于形状先验与边界优化的研究。
以上内容由遇见数据集搜集并总结生成



