ConnorLuckettDSTG/SARFishSample
收藏Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ConnorLuckettDSTG/SARFishSample
下载链接
链接失效反馈官方服务:
资源简介:
SARFish是一个合成孔径雷达(SAR)图像数据集,旨在用于训练、验证和测试监督机器学习模型,主要任务包括船舶检测、分类和长度回归。该数据集基于xView3-SAR数据集,并扩展了其内容,包括来自欧洲空间局(ESA)哥白尼计划的单视复(SLC)和地面范围检测(GRD)图像数据。数据集分为数据和标签两部分,数据部分扩展了xView3-SAR数据集,标签部分则提供了海上物体的位置、船舶分类和船舶长度信息。
SARFish is a synthetic aperture radar (SAR) image dataset developed for training, validating, and testing supervised machine learning models, with primary tasks encompassing vessel detection, classification, and length regression. Built upon the xView3-SAR dataset, this dataset expands its scope by integrating single look complex (SLC) and ground range detected (GRD) image data sourced from the European Space Agency (ESA) Copernicus Programme. The dataset is divided into two core segments: data and labels. The data segment extends the xView3-SAR dataset, while the label segment provides detailed information including the positions of maritime objects, vessel categories, and the lengths of vessels.
提供机构:
ConnorLuckettDSTG
原始信息汇总
SARFish 数据集概述
数据集基本信息
- 许可证: Apache-2.0
- 任务类别:
- 目标检测
- 图像分类
- 标签:
- SARFish
- Illegal Fishing
- Computer Vision
- Complex-Valued
- Synthetic Aperture Radar
- 数据集名称: SARFish Sample Dataset
- 数据集规模: n<1K
数据集描述
SARFish 数据集是一个用于训练、验证和测试监督机器学习模型的合成孔径雷达(SAR)图像数据集,主要用于船舶检测、分类和长度回归任务。该数据集基于 xView3-SAR 数据集(2021)构建,包含以下两部分:
- 数据: 扩展了 xView3-SAR 数据集,包括单视复数(SLC)和地面范围检测(GRD)图像数据,这些数据直接从欧洲空间局(ESA)的哥白尼计划开放访问中心网站获取。
- 标签: 从 xView3-SAR 数据集派生标签,提供海上物体位置、船舶分类和船舶长度信息。
数据集下载链接
- 完整数据集: SARFish
- 样本数据集: SARFishSample
- 标签: 下载链接
数据集大小总结
| 数据集 | 同时出现的 GRD, SLC 产品 | 压缩大小 (GB) | 未压缩大小 (GB) |
|---|---|---|---|
| SARFishSample | 1 | 4.3 | 8.2 |
| SARFish | 753 | 3293 | 6468 |
数据集分区总结
| 分区 | 同时出现的产品 | 提供的标签 | 唯一海上物体标签 | | --- | --- | --- | --- | --- | | | | | SLC | GRD | | 训练 | 553 | 是 | 63071 | 64054 | | 验证 | 50 | 是 | 18906 | 19222 | | 公开 | 150 | 否 | 58744 | 60008 | | | | 总计 | 140721 | 143284 |
数据集访问方法
完整 SARFish 数据集
确保有足够的存储空间用于未压缩的数据集。 bash cd /path/to/large/storage/location huggingface-cli login git lfs install git clone https://huggingface.co/datasets/ConnorLuckettDSTG/SARFish
SARFish 样本数据集
替换完整数据集的最后命令: bash git clone https://huggingface.co/datasets/ConnorLuckettDSTG/SARFishSample
数据集标签
位置标签
| 字段 | 数据类型 | 描述 |
|---|---|---|
| detect_lat | float | 检测的纬度(WGS84 坐标) |
| detect_lon | float | 检测的经度(WGS84 坐标) |
| detect_scene_row | int | 包含检测的场景像素行 |
| detect_scene_column | int | 包含检测的场景像素列 |
分类标签
| 字段 | 数据类型 | 描述 |
|---|---|---|
| is_vessel | bool | 如果检测是船舶,则为 True,否则为 False |
| is_fishing | bool | 如果检测是渔船,则为 True,否则为 False |
船舶长度标签
| 字段 | 数据类型 | 描述 |
|---|---|---|
| vessel_length_m | float | 船舶长度(米),仅在 AIS 数据可用时提供 |
详细标签总结
| 字段 | 数据类型 | 描述 |
|---|---|---|
| partition | str: {"train", "validation"} | 数据集的分区 |
| product_type | str: {"GRD", "SLC"} | 数据的产品类型 |
| scene_id | str | 用于挑战目的的唯一 xView3 场景 ID |
| detect_id | str | 唯一检测 ID,格式为:{scene_id}{detect_lat}{detect_lon} |
| {product_type}_product_identifier | str | 指定产品类型的哥白尼哨兵-1 产品标识符 |
| detect_lat | float | 检测的纬度(WGS84 坐标) |
| detect_lon | float | 检测的经度(WGS84 坐标) |
| detect_scene_row | int | 包含检测的场景像素行 |
| detect_scene_column | int | 包含检测的场景像素列 |
| top | float | 边界框左上角的像素行,如果可用 |
| left | float | 边界框左上角的像素列,如果可用 |
| bottom | float | 边界框右下角的像素行,如果可用 |
| right | float | 边界框右下角的像素列,如果可用 |
| vessel_length_m | float | 船舶长度(米),仅在 AIS 数据可用时提供 |
| source | str: {AIS, AIS/Manual, Manual} | 检测的来源(AIS、手动标签或两者) |
| is_vessel | bool | 如果检测是船舶,则为 True,否则为 False |
| is_fishing | bool | 如果检测是渔船,则为 True,否则为 False |
| global_shoreline_vector_distance_from_shore_km | float | 使用全球海岸线向量投影到 SARFish 产品像素空间中检测的海岸距离(公里) |
| xView3_shoreline_vector_distance_from_shore_km | float | 使用 xView3-SAR 海岸线向量投影到 SARFish 产品像素空间中检测的海岸距离(公里) |
| confidence | str: {HIGH, MEDIUM, LOW} | is_vessel 和 is_fishing 标签的置信度级别 |
搜集汇总
数据集介绍

构建方式
在合成孔径雷达(SAR)遥感领域,SARFishSample数据集构建于xView3-SAR数据集基础之上,通过欧洲空间局(ESA)哥白尼计划的开放访问中心,获取了Sentinel-1 C波段SAR卫星星座的影像数据。该数据集不仅包含原有的地面距离探测(GRD)产品,还引入了单视复数(SLC)产品,从而扩展了数据的多样性与复杂性。标签信息则直接衍生自xView3-SAR数据集,提供了海上目标的位置、船舶分类及长度等标注,确保了数据标注的一致性与可靠性。
使用方法
使用SARFishSample数据集时,研究人员可通过HuggingFace平台直接下载样本数据,或参考GitHub仓库中的详细指南进行完整数据集的获取与验证。数据集已划分为训练、验证及公开测试分区,支持监督学习模型的训练与评估。用户可加载GeoTiff格式的影像数据及相应的标签文件,利用提供的坐标与分类信息,开发针对海上目标检测、分类及长度回归的机器学习模型,并通过基线模型进行性能比较与优化。
背景与挑战
背景概述
合成孔径雷达(SAR)技术在海洋监测领域具有独特优势,能够穿透云层和恶劣天气,实现对海上目标的持续观测。SARFish数据集由澳大利亚国防科技集团(DSTG)等机构于2022年创建,其核心研究问题在于利用SAR影像提升对海上船舶的检测、分类与长度回归能力,特别是针对非法捕捞等海事监管挑战。该数据集在xView3-SAR数据集基础上进行了重要扩展,首次同时提供了单视复数据(SLC)与地距探测数据(GRD),为复杂值深度学习模型的研究提供了关键资源,显著推动了SAR影像在计算机视觉领域的应用深度。
当前挑战
SARFish数据集旨在解决海上目标智能解译这一核心领域问题,其面临的主要挑战包括:SAR影像中固有的相干斑噪声严重干扰目标特征提取;近岸复杂背景与船舶侧瓣效应导致检测精度下降;以及不同极化方式下目标散射特性的差异为分类任务带来困难。在数据集构建过程中,挑战同样突出:需从欧洲航天局哨兵一号卫星海量数据中精确匹配并处理753组同步的SLC与GRD产品;同时要确保从xView3-SAR衍生的标签在坐标转换与产品对齐过程中保持空间一致性;此外,复杂值数据的存储、处理与可视化对传统图像分析流程提出了全新的技术要求。
常用场景
经典使用场景
在合成孔径雷达(SAR)遥感领域,SARFishSample数据集为海洋监测任务提供了关键的数据支持。该数据集整合了Sentinel-1卫星的GRD和SLC两种产品类型,覆盖了船舶检测、分类及长度回归等多个计算机视觉任务。经典使用场景包括利用其标注的海上目标位置、船舶类别及长度信息,训练和验证监督式机器学习模型,以提升在复杂海况下对非法捕捞等活动的识别能力。数据集特别强调对近岸区域目标的检测,通过结合海岸线掩膜数据,增强了模型在实际应用中的鲁棒性。
解决学术问题
SARFishSample数据集有效应对了SAR图像分析中的若干核心学术挑战。它通过提供同步的GRD和SLC产品,解决了传统研究中因数据模态单一而导致的特征提取不充分问题,促进了多模态融合方法的发展。数据集中包含的复杂值SLC图像,为探索复数域深度学习模型提供了实验基础,有助于突破实值图像处理的局限性。此外,精细的船舶分类和长度标注,支持了细粒度目标识别与回归任务的研究,推动了遥感图像解译算法在精度与泛化能力上的进步。
实际应用
该数据集的实际应用价值主要体现在全球海洋治理与安全监控领域。基于SARFishSample训练的模型,可部署于卫星遥感系统,实现对广阔海域中船舶目标的自动化、实时检测与分类,特别适用于监测非法、未报告和无管制(IUU)捕捞活动。政府部门和国际组织可利用此类技术,增强对海洋资源的保护与管理,提升执法效率。同时,在航运管理、海上搜救及环境监测等场景中,数据集也能为决策提供可靠的数据洞察,支撑可持续海洋发展战略。
数据集最近研究
最新研究方向
在合成孔径雷达(SAR)遥感领域,SARFish数据集凭借其同时提供的单视复(SLC)与地距探测(GRD)影像,正推动海洋监视技术的前沿探索。当前研究聚焦于利用复杂值数据提升对海上目标,尤其是非法捕鱼船只的检测与分类精度,结合深度学习模型处理非均匀像素间距与多极化信息。该数据集通过Kaggle竞赛等形式,促进了计算机视觉与复杂值信号处理的交叉融合,为全球海洋治理提供了关键的数据支撑,其影响延伸至环境监测与海事安全等多个热点领域。
以上内容由遇见数据集搜集并总结生成



