five

ConnorLuckettDSTG/SARFish

收藏
Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ConnorLuckettDSTG/SARFish
下载链接
链接失效反馈
官方服务:
资源简介:
SARFish是一个合成孔径雷达(SAR)图像数据集,旨在训练、验证和测试监督机器学习模型,特别是在船舶检测、分类和长度回归任务上。该数据集基于xView3-SAR数据集,并扩展了来自欧洲空间局(ESA)Copernicus计划的单视复(SLC)和地面范围检测(GRD)图像数据。标签部分从xView3-SAR数据集派生,提供了海上物体的位置、船舶分类和船舶长度信息。数据集包括训练、验证和公开测试集,分别包含不同数量的图像和标签。

SARFish is a synthetic aperture radar (SAR) image dataset dedicated to training, validating, and testing supervised machine learning models, particularly for ship detection, classification, and length regression tasks. This dataset is based on the xView3-SAR dataset, and expands with single-look complex (SLC) and ground range detected (GRD) image data from the European Space Agency (ESA) Copernicus Programme. The labels are derived from the xView3-SAR dataset, providing the positions of maritime objects, ship classification categories, and ship length information. The dataset includes training, validation, and public test sets, which contain varying numbers of images and corresponding labels respectively.
提供机构:
ConnorLuckettDSTG
原始信息汇总

SARFish 数据集概述

数据集基本信息

  • 许可证: Apache-2.0
  • 任务类别:
    • 目标检测
    • 图像分类
  • 标签:
    • SARFish
    • Illegal Fishing
    • Computer Vision
    • Complex-Valued
    • Synthetic Aperture Radar
  • 易读名称: SARFish Dataset
  • 大小类别: n<1K

数据集描述

SARFish 数据集是一个用于训练、验证和测试监督机器学习模型的合成孔径雷达(SAR)图像数据集,主要用于船舶检测、分类和长度回归任务。该数据集基于 xView3-SAR 数据集(2021年)构建,包含以下两部分:

  1. 数据: 扩展了 xView3-SAR 数据集,包括单视复数(SLC)和地面范围检测(GRD)图像数据,这些数据直接从欧洲空间局(ESA)的哥白尼计划开放访问中心网站获取。
  2. 标签: 从 xView3-SAR 数据集派生标签,提供海上物体位置、船舶分类和船舶长度信息。

数据集大小和分区

数据集大小

数据集 重合的 GRD, SLC 产品 压缩大小 (GB) 未压缩大小 (GB)
SARFishSample 1 4.3 8.2
SARFish 753 3293 6468

数据集分区

| 分区 | 重合的产品 | 提供的标签 | 唯一的海上物体标签 | | --- | --- | --- | --- | --- | | | | | SLC | GRD | | 训练 | 553 | 是 | 63071 | 64054 | | 验证 | 50 | 是 | 18906 | 19222 | | 公开 | 150 | 否 | 58744 | 60008 | | | | 总计 | 140721 | 143284 |

数据集访问

SARFish 数据集可通过以下链接下载:

数据集内容

SARFish 数据集扩展了 xView3-SAR 数据集,提供了来自哨兵-1 C波段 SAR 卫星星座的实值 GRD 和复值 SLC 产品类型,这些数据由欧洲空间局(ESA)的哥白尼计划在其开放访问中心网站上提供。

产品类型比较

平台 哨兵-1 (A, B)
运营商 欧洲空间局(ESA)哨兵-1任务性能中心
传感器 C波段 SAR
模式 干涉宽幅(IW)
极化 VV, VH
地面范围覆盖(km) 251.8
产品类型 SLC GRD
像素值 复数 幅度检测
数据类型 复数 Int16 无符号 Int16
方位像素间距(m) 2.3 10
距离像素间距(m) 14.1 10

地面范围检测(GRD)产品

GRD 产品包含 VH 和 VV 极化的两个“检测”图像产品。图像数据以 GeoTiff 格式存储。数据集中还包括无数据掩膜和海岸线文件,用于评估“近岸”海上物体检测任务。

单视复数(SLC)产品

SLC 产品示例图像展示了 VH 极化的 SARFish SLC 产品中的“条带”,并带有海上物体的地面真实标签。复数数据通过将复数值数据投影到实数上进行“检测”,以便可视化,并在15至60 dB的动态范围内显示在分贝尺度上。注意,SLC 产品具有非方形(x, y):2.3 × 14.1 m 的像素间距。数据的原始格式是复数 Int16。

标签

位置标签

标签表示海上物体的图像像素和地理坐标位置。

字段 数据类型 描述
detect_lat float 检测的纬度(WGS84坐标)
detect_lon float 检测的经度(WGS84坐标)
detect_scene_row int 包含检测的场景的像素行
detect_scene_column int 包含检测的场景的像素列

分类标签

海上物体分类标签按照 xView3-SAR 挑战标签的相同层次结构组织:

bash label_heirarchy: └── maritime_objects └── vessels └── fishing_vessels

标签由以下列表示:

字段 数据类型 描述
is_vessel bool 如果检测是船舶,则为 True,否则为 False
is_fishing bool 如果检测是渔船,则为 True,否则为 False

海上物体类别使用布尔值标记以下问题:

  • 海上物体是船舶吗?
  • 船舶是渔船吗?

船舶长度标签

船舶长度由以下列表示:

字段 数据类型 描述
vessel_length_m float 船舶长度(米);仅在从 AIS 获得时提供

详细标签摘要

字段 数据类型 描述
partition str: {"train", "validation"} 数据集的分区
product_type str: {"GRD", "SLC"} 数据的产品类型
scene_id str 挑战用途的唯一 xView3 场景 ID
detect_id str 唯一检测 ID,格式为:{scene_id}{detect_lat}{detect_lon}
{product_type}_product_identifier str 指定产品类型的哥白尼哨兵-1产品标识符
detect_lat float 检测的纬度(WGS84坐标)
detect_lon float 检测的经度(WGS84坐标)
detect_scene_row int 包含检测的场景的像素行
detect_scene_column int 包含检测的场景的像素列
top float 边界框左上角的像素行,如果可用
left float 边界框左上角的像素列,如果可用
bottom float 边界框右下角的像素行,如果可用
right float 边界框右下角的像素列,如果可用
vessel_length_m float 船舶长度(米);仅在从 AIS 获得时提供
source str: {AIS, AIS/Manual, Manual} 检测来源(AIS、手动标签或两者)
is_vessel bool 如果检测是船舶,则为 True,否则为 False
is_fishing bool 如果检测是渔船,则为 True,否则为 False
global_shoreline_vector_distance_from_shore_km float 使用全球海岸线向量投影到 SARFish 产品像素空间中检测到距离海岸的距离(公里)
xView3_shoreline_vector_distance_from_shore_km float 使用 xView3-SAR 海岸线向量投影到 SARFish 产品像素空间中检测到距离海岸的距离(公里)
confidence str: {HIGH, MEDIUM, LOW} is_vessel 和 is_fishing 标签的置信度级别
搜集汇总
数据集介绍
main_image_url
构建方式
在合成孔径雷达(SAR)遥感领域,SARFish数据集以xView3-SAR数据集为基础,进行了显著扩展。其构建过程首先从欧洲空间局(ESA)哥白尼计划的开放访问中心获取Sentinel-1卫星的原始数据,涵盖了地面距离探测(GRD)和单视复数(SLC)两种产品类型。标签信息则继承自xView3-SAR数据集,提供了海上目标的位置、船舶分类及长度数据。整个数据集包含753对同步的GRD与SLC产品,并划分为训练集、验证集和公开测试集,确保了数据在机器学习的监督任务中的完整性与可用性。
特点
SARFish数据集的核心特点在于其同时提供了实数值的GRD图像与复数值的SLC图像,这为研究复杂值深度学习算法在SAR图像解译中的应用创造了条件。数据集包含VV和VH两种极化方式,并提供了非正方形的像素间距(2.3米×14.1米),更精确地反映了SAR传感器的原始观测特性。此外,数据集附带了丰富的标注信息,包括目标的地理坐标、像素位置、船舶分类(是否为船舶、是否为渔船)以及基于AIS数据的船舶长度,并提供了海岸线距离和标注置信度,为复杂场景下的模型训练与评估提供了多维度的监督信号。
使用方法
该数据集主要用于训练、验证和测试监督式机器学习模型,具体任务包括海上目标检测、船舶分类和船舶长度回归。研究人员可通过Hugging Face平台下载完整数据集或样本数据集,并参考其GitHub仓库中的说明进行数据加载与预处理。数据以GeoTiff格式存储,标签为结构化表格。典型的使用流程包括:通过官方脚本验证数据完整性并解压;利用提供的Jupyter Notebook演示如何加载图像与标签;基于划分好的训练集和验证集开发模型;最后,可在未提供标签的公开测试集上进行预测,并参与相关的Kaggle竞赛以评估模型性能。
背景与挑战
背景概述
SARFish数据集作为合成孔径雷达(SAR)影像领域的重要资源,由澳大利亚国防科技集团(DSTG)等机构的研究人员于2022年构建,旨在应对全球非法捕捞监测的迫切需求。该数据集基于xView3-SAR数据集扩展而成,整合了欧洲航天局哨兵一号卫星的复杂值单视复(SLC)与实值地距探测(GRD)影像产品,专注于船舶检测、分类及长度回归等多任务学习。其创新性在于首次系统性地融合了双模SAR数据与精细层级标注,为海洋监视与遥感智能分析提供了关键基准,显著推动了计算机视觉在复杂电磁环境下的应用边界。
当前挑战
在领域问题层面,SARFish致力于解决远海非法捕捞监测中船舶目标的小尺度、低信噪比及复杂海况干扰等核心难题,尤其需克服SAR影像固有的斑点噪声与侧瓣伪影对模型泛化能力的制约。构建过程中,挑战主要体现在多源数据对齐与标注一致性维护:需将xView3-SAR的标签体系精准映射至不同分辨率与物理特性的SLC与GRD影像,同时处理非均匀像素间距(2.3米×14.1米)带来的几何校正复杂性。此外,复杂值数据的存储、可视化及模型适配亦对计算架构与算法设计提出了特殊要求。
常用场景
经典使用场景
在合成孔径雷达(SAR)遥感领域,SARFish数据集为监督式机器学习模型提供了经典的训练与评估平台。该数据集整合了单视复(SLC)和地距探测(GRD)两种Sentinel-1卫星影像产品,并标注了船舶位置、类别及长度信息。其核心应用场景在于支持多任务学习框架,包括海上目标检测、船舶分类以及船体长度回归,尤其适用于处理复杂SAR影像中的高分辨率特征提取与模式识别问题。
实际应用
在实际海洋监测体系中,SARFish数据集支撑了非法捕捞监管、海上交通管理与灾害应急响应等关键应用。基于该数据集训练的模型能够从卫星SAR影像中自动识别渔船活动,辅助国际组织对远海区域进行大范围、全天候监测,弥补了传统巡逻手段在覆盖范围与时效性上的不足。此外,其提供的船舶长度信息可用于评估渔业资源开发强度,为可持续海洋政策制定提供数据依据。
衍生相关工作
围绕SARFish数据集,学术界衍生了一系列经典研究工作。例如,基于其复数影像特性开发的深度复数神经网络,提升了SAR目标检测的精度与鲁棒性;结合xView3-SAR数据集的扩展研究,形成了多源SAR数据融合分析的技术框架。相关成果已在IEEE国际会议及arXiv预印本平台上发表,并催生了Kaggle平台上的多项公开竞赛,持续推动着SAR影像解译算法与开源工具生态的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作