NOMAD

Name: NOMAD
Creator: 计算机科学与工程系，圣母大学，印第安纳州，美国
Published: 2023-09-18 14:57:00
License: 暂无描述

arXiv2023-09-18 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2309.09518v1

下载链接

链接失效反馈

官方服务：

资源简介：

NOMAD（自然遮挡多尺度航空数据集）是为紧急响应场景设计的，专注于在遮挡的航空视角下进行人体检测。数据集包含100名不同演员，执行行走、躺下和隐藏等序列，共计42,825帧，来自5.4k分辨率视频，并手动标注了边界框和描述10种不同可见度级别的标签。NOMAD旨在通过提供新的基准数据集，改善航空搜索和救援的效率，并增强小型无人机系统（sUAS）与人类之间的协作，解决紧急响应场景中的遮挡问题。

NOMAD (Natural Occlusion Multi-scale Aerial Dataset) is developed for emergency response scenarios, with a primary focus on human detection in occluded aerial viewpoints. The dataset consists of 100 distinct actors performing sequences of actions including walking, lying down, and hiding, totaling 42,825 frames sourced from 5.4K-resolution videos. All frames are paired with manually annotated bounding boxes and labels that specify 10 distinct visibility levels. NOMAD aims to boost the efficiency of aerial search and rescue, strengthen collaboration between small unmanned aerial systems (sUAS) and human personnel, and mitigate occlusion-related issues in emergency response contexts by providing this novel benchmark dataset.

提供机构：

计算机科学与工程系，圣母大学，印第安纳州，美国

创建时间：

2023-09-18

搜集汇总

数据集介绍

构建方式

在无人机辅助应急响应的研究背景下，NOMAD数据集的构建遵循了严谨的采集与标注流程。数据采集过程在伦理审查委员会批准的协议下进行，招募了100名不同年龄、性别和种族的参与者，在12个涵盖自然与人造环境的多样化地点进行拍摄。每位参与者在五个不同高度（10米至90米）下执行包含行走、躺卧和隐藏动作的标准行为序列，以模拟应急场景中可能出现的遮挡情况。视频以5.4K分辨率录制，并从中策略性地选取了总计42,825个关键帧。所有帧均通过专业标注公司进行手动标注，为每个可见人体标注边界框，并依据身体部位可见百分比计算并分配了10个级别的可见性标签，从而系统性地量化了遮挡程度。

使用方法

NOMAD数据集主要服务于提升空中计算机视觉模型在应急响应场景下的性能。研究人员可利用其带有精细遮挡标签的标注数据，作为基准来评估和提升现有目标检测模型（如YOLO、Faster R-CNN等）在遮挡条件下的鲁棒性。其多尺度数据支持开发通用或针对特定高度的专用人员检测模型。同时，结合提供的人员元数据（如衣着、体型描述）和地面参考视图，该数据集可用于训练和验证从空中视角进行人员重识别的算法。此外，基于按行为轨迹选取的关键帧序列，该数据集也适用于评估人员跟踪算法的性能，模拟从检测到持续跟踪的完整应急响应流程。

背景与挑战

背景概述

随着小型无人机系统在搜救等应急响应场景中的广泛应用，计算机视觉能力的集成已成为任务成功的关键因素。然而，当视角从地面转向空中时，人体检测的计算机视觉性能会严重下降。为缓解这一问题，诺特丹大学的研究团队于近年创建了NOMAD数据集，旨在专门解决遮挡这一应急响应中的核心难题。该数据集包含100名不同演员在五种飞行距离下执行行走、躺卧和隐藏等动作序列，提供了42,825帧高分辨率图像，并标注了边界框及基于人体可见比例的十级能见度标签。NOMAD通过其自然场景多样性、多尺度距离覆盖和精细化遮挡标注，为空中视角下的人体检测研究设立了新基准，显著推动了无人机辅助应急响应领域的发展。

当前挑战

NOMAD数据集致力于解决空中视角下人体检测的遮挡难题，这一挑战在应急响应场景中尤为突出，例如受害者被水体、废墟或植被部分遮蔽。现有数据集往往忽视遮挡问题，导致模型在真实复杂环境中性能锐减。构建过程中，研究团队面临多重挑战：在数据采集阶段，需在多样自然与人工场景中协调大量演员完成自然行为，同时确保跨季节、跨人口统计的多样性以降低偏差；在标注阶段，手动为四万余帧图像划分十级能见度标签需要极高精度与一致性，且需处理非参与者意外入镜等伦理与数据质量问题。这些挑战共同凸显了创建高质量、高泛化性遮挡数据集的复杂性。

常用场景

经典使用场景

在无人机辅助的紧急响应领域，NOMAD数据集为空中视角下的人员检测提供了关键基准。该数据集通过模拟搜救任务中常见的遮挡场景，如人员被树木、岩石或水体部分遮蔽，为计算机视觉模型提供了多样化的训练与评估环境。其多尺度特性覆盖了从10米到90米的不同飞行高度，使得模型能够在不同距离下应对遮挡挑战，从而提升在复杂自然环境中的检测鲁棒性。

解决学术问题

NOMAD数据集主要解决了空中视角下人员检测因遮挡导致的性能退化问题。传统数据集往往忽视遮挡这一关键因素，而NOMAD通过精细标注的十个可见性等级，为学术界提供了量化评估模型在部分可见场景下表现的能力。这不仅推动了遮挡感知检测算法的发展，还促进了跨尺度泛化研究，为无人机在紧急响应中的实际部署奠定了理论基础。

实际应用

该数据集直接支持无人机在搜救、灾害响应等现实任务中的应用。通过提供涵盖不同季节、地形和人口特征的多样化数据，NOMAD能够帮助训练出适应野外、水域及城市环境的检测系统。例如，在地震后的人员搜救中，无人机可利用基于NOMAD训练的模型，快速识别被废墟部分掩埋的受害者，显著提升救援效率与成功率。

数据集最近研究