ConnorLuckettDSTG/SARFish
收藏SARFish 数据集概述
数据集基本信息
- 许可证: Apache-2.0
- 任务类别:
- 目标检测
- 图像分类
- 标签:
- SARFish
- Illegal Fishing
- Computer Vision
- Complex-Valued
- Synthetic Aperture Radar
- 易读名称: SARFish Dataset
- 大小类别: n<1K
数据集描述
SARFish 数据集是一个用于训练、验证和测试监督机器学习模型的合成孔径雷达(SAR)图像数据集,主要用于船舶检测、分类和长度回归任务。该数据集基于 xView3-SAR 数据集(2021年)构建,包含以下两部分:
- 数据: 扩展了 xView3-SAR 数据集,包括单视复数(SLC)和地面范围检测(GRD)图像数据,这些数据直接从欧洲空间局(ESA)的哥白尼计划开放访问中心网站获取。
- 标签: 从 xView3-SAR 数据集派生标签,提供海上物体位置、船舶分类和船舶长度信息。
数据集大小和分区
数据集大小
| 数据集 | 重合的 GRD, SLC 产品 | 压缩大小 (GB) | 未压缩大小 (GB) |
|---|---|---|---|
| SARFishSample | 1 | 4.3 | 8.2 |
| SARFish | 753 | 3293 | 6468 |
数据集分区
| 分区 | 重合的产品 | 提供的标签 | 唯一的海上物体标签 | | --- | --- | --- | --- | --- | | | | | SLC | GRD | | 训练 | 553 | 是 | 63071 | 64054 | | 验证 | 50 | 是 | 18906 | 19222 | | 公开 | 150 | 否 | 58744 | 60008 | | | | 总计 | 140721 | 143284 |
数据集访问
SARFish 数据集可通过以下链接下载:
数据集内容
SARFish 数据集扩展了 xView3-SAR 数据集,提供了来自哨兵-1 C波段 SAR 卫星星座的实值 GRD 和复值 SLC 产品类型,这些数据由欧洲空间局(ESA)的哥白尼计划在其开放访问中心网站上提供。
产品类型比较
| 平台 | 哨兵-1 (A, B) | |
| 运营商 | 欧洲空间局(ESA)哨兵-1任务性能中心 | |
| 传感器 | C波段 SAR | |
| 模式 | 干涉宽幅(IW) | |
| 极化 | VV, VH | |
| 地面范围覆盖(km) | 251.8 | |
| 产品类型 | SLC | GRD |
| 像素值 | 复数 | 幅度检测 |
| 数据类型 | 复数 Int16 | 无符号 Int16 |
| 方位像素间距(m) | 2.3 | 10 |
| 距离像素间距(m) | 14.1 | 10 |
地面范围检测(GRD)产品
GRD 产品包含 VH 和 VV 极化的两个“检测”图像产品。图像数据以 GeoTiff 格式存储。数据集中还包括无数据掩膜和海岸线文件,用于评估“近岸”海上物体检测任务。
单视复数(SLC)产品
SLC 产品示例图像展示了 VH 极化的 SARFish SLC 产品中的“条带”,并带有海上物体的地面真实标签。复数数据通过将复数值数据投影到实数上进行“检测”,以便可视化,并在15至60 dB的动态范围内显示在分贝尺度上。注意,SLC 产品具有非方形(x, y):2.3 × 14.1 m 的像素间距。数据的原始格式是复数 Int16。
标签
位置标签
标签表示海上物体的图像像素和地理坐标位置。
| 字段 | 数据类型 | 描述 |
|---|---|---|
| detect_lat | float | 检测的纬度(WGS84坐标) |
| detect_lon | float | 检测的经度(WGS84坐标) |
| detect_scene_row | int | 包含检测的场景的像素行 |
| detect_scene_column | int | 包含检测的场景的像素列 |
分类标签
海上物体分类标签按照 xView3-SAR 挑战标签的相同层次结构组织:
bash label_heirarchy: └── maritime_objects └── vessels └── fishing_vessels
标签由以下列表示:
| 字段 | 数据类型 | 描述 |
|---|---|---|
| is_vessel | bool | 如果检测是船舶,则为 True,否则为 False |
| is_fishing | bool | 如果检测是渔船,则为 True,否则为 False |
海上物体类别使用布尔值标记以下问题:
- 海上物体是船舶吗?
- 船舶是渔船吗?
船舶长度标签
船舶长度由以下列表示:
| 字段 | 数据类型 | 描述 |
|---|---|---|
| vessel_length_m | float | 船舶长度(米);仅在从 AIS 获得时提供 |
详细标签摘要
| 字段 | 数据类型 | 描述 |
|---|---|---|
| partition | str: {"train", "validation"} | 数据集的分区 |
| product_type | str: {"GRD", "SLC"} | 数据的产品类型 |
| scene_id | str | 挑战用途的唯一 xView3 场景 ID |
| detect_id | str | 唯一检测 ID,格式为:{scene_id}{detect_lat}{detect_lon} |
| {product_type}_product_identifier | str | 指定产品类型的哥白尼哨兵-1产品标识符 |
| detect_lat | float | 检测的纬度(WGS84坐标) |
| detect_lon | float | 检测的经度(WGS84坐标) |
| detect_scene_row | int | 包含检测的场景的像素行 |
| detect_scene_column | int | 包含检测的场景的像素列 |
| top | float | 边界框左上角的像素行,如果可用 |
| left | float | 边界框左上角的像素列,如果可用 |
| bottom | float | 边界框右下角的像素行,如果可用 |
| right | float | 边界框右下角的像素列,如果可用 |
| vessel_length_m | float | 船舶长度(米);仅在从 AIS 获得时提供 |
| source | str: {AIS, AIS/Manual, Manual} | 检测来源(AIS、手动标签或两者) |
| is_vessel | bool | 如果检测是船舶,则为 True,否则为 False |
| is_fishing | bool | 如果检测是渔船,则为 True,否则为 False |
| global_shoreline_vector_distance_from_shore_km | float | 使用全球海岸线向量投影到 SARFish 产品像素空间中检测到距离海岸的距离(公里) |
| xView3_shoreline_vector_distance_from_shore_km | float | 使用 xView3-SAR 海岸线向量投影到 SARFish 产品像素空间中检测到距离海岸的距离(公里) |
| confidence | str: {HIGH, MEDIUM, LOW} | is_vessel 和 is_fishing 标签的置信度级别 |




