Weddell Sea Benthic Dataset (WSBD)
收藏arXiv2025-07-29 更新2025-07-31 收录
下载链接:
https://doi.org/10.5285/1BA97E4B-EFB7-460B-9F2D-90437E33CE09
下载链接
链接失效反馈官方服务:
资源简介:
Weddell Sea Benthic Dataset (WSBD) 是首个用于南极海底生物多样性监测的公开计算机视觉数据集,由英国南极调查局和剑桥大学的研究人员在南极Weddell海使用高分辨率拖曳相机系统OFOBS收集。该数据集包含100张高分辨率海底影像,共标注了31,280个边界框,覆盖25种形态各异的类,从广泛的分类群到物种级别。数据集展示了南极海底环境的多样性,包括不同的深度、海底倾斜角度、底质类型和光照条件。WSBD数据集对于评估海底生物检测框架的性能具有重要意义,特别是在高分辨率影像中小型或稀有物种的检测方面。
Weddell Sea Benthic Dataset (WSBD) is the first publicly available computer vision dataset for Antarctic benthic biodiversity monitoring. It was collected by researchers from the British Antarctic Survey and the University of Cambridge using the high-resolution towed camera system OFOBS in the Weddell Sea, Antarctica. The dataset contains 100 high-resolution benthic images, with a total of 31,280 annotated bounding boxes, covering 25 morphologically distinct taxa ranging from broad taxonomic groups to species-level classifications. It showcases the diversity of Antarctic benthic habitats, including varying water depths, seabed slope angles, substrate types and lighting conditions. The WSBD dataset is of great significance for evaluating the performance of benthic organism detection frameworks, particularly for the detection of small or rare species in high-resolution images.
提供机构:
英国南极调查局(British Antarctic Survey)和剑桥大学(University of Cambridge)
创建时间:
2025-07-29
原始信息汇总
数据集概述:The Weddell Sea Benthic Dataset
摘要
- 数据集名称:The Weddell Sea Benthic Dataset (WSBD)
- 内容:用于计算机视觉的高分辨率海底图像及对应标注,支持南极底栖群落的自动化分析
- 数据来源:2019年RV Polarstern Expedition PS118(航次69-1和69-6)使用OFOBS系统拍摄
- 标注:由英国南极调查局(BAS)生态学家手动标注,包含25种形态类型的类别标签
- 格式:COCO格式的边界框标注,包含训练集、验证集和测试集划分
- 用途:为开发南极底栖环境生物多样性监测的机器学习模型提供基准
关键信息
基本元数据
- 创建日期:2025-06-06
- 数据集状态:已完成
- 语言:英语
- ISO主题分类:生物群、环境、海洋
- 参数:生物圈 > 生态动力学 > 生物多样性;海洋 > 海洋环境监测
时空覆盖
- 时间范围:
- 2019-02-01至2019-04-30(数据采集)
- 2024-09-01至2025-05-31(其他相关时间)
- 空间范围:
- 纬度:-64.93935至-61.19232
- 经度:-57.81626至-50.99663
- 深度:421米至2202米
- 地理位置:南大洋,威德尔海,Powell Basin
数据组成
- 图像:100个JPG文件(115.5MB)
- 标注:4个JSON文件(22.8MB)
访问与使用
访问方式
- 数据获取:http://ramadda.data.bas.ac.uk/repository/entry/show?entryid=1ba97e4b-efb7-460b-9f2d-90437e33ce09
- 项目主页:https://www.bas.ac.uk/project/the-evolution-and-ecology-of-antarctic-sea-floor-communities/
- 相关软件包:https://github.com/Trotts/antarctic-benthic-organism-detection
约束条件
- 访问限制:数据在相关手稿发表前处于禁运期
- 使用限制:根据Open Government Licence v3.0提供
人员与机构
- 主要研究者:
- Cameron Trotter(英国南极调查局)
- Huw J Griffiths(英国南极调查局)
- Tasnuva M Khan(英国南极调查局)
- Autun Purser(阿尔弗雷德·韦格纳极地与海洋研究所)
- Rowan J Whittle(英国南极调查局)
参考文献
- Purser et al. (2021). Seabed video and still images from the northern Weddell Sea. Earth Syst. Sci. Data 13, 609-615. https://doi.org/10.5194/essd-13-609-2021
- Purser et al. (2020). OFOBS seafloor images from the antarctic peninsula and powell basin. https://doi.org/10.1594/PANGAEA.911904
- Khan et al. (2024). Network analyses on photographic surveys. Front. Mar. Sci. 11, 1408828. https://doi.org/10.3389/fmars.2024.1408828
- Khan et al. (2025). Organisms identified from OFOBS images. https://doi.org/10.5285/7fb2f0c1-413c-4cd6-84ab-a504bf431290
搜集汇总
数据集介绍

构建方式
Weddell Sea Benthic Dataset (WSBD) 的构建基于南极威德尔海海底的高分辨率原位图像,这些图像通过拖曳式摄像系统 Ocean Floor Observation and Bathymetry System (OFOBS) 采集。数据采集过程中,摄像系统在海底上方近距离运行,捕捉了多样化的环境条件,包括不同的浊度、光照水平和底质类型。数据集包含100张经过手动标注的图像,涵盖了421至2202米的深度范围和0至80度的海底倾斜度。标注工作由专家完成,将图像中的生物划分为25个形态学类别,从广泛的分类群到物种级别。为确保数据质量,标注过程中对失真或难以识别的区域进行了裁剪,最终形成了大小不一的图像集合。
特点
WSBD 数据集具有高度的视觉复杂性和生态真实性,图像中包含了大量的背景杂乱、光照变化、阴影和重叠物体。数据集中的生物密度较高,单个图像的标注数量从5到1693不等,平均每张图像有312.8个标注。此外,数据集呈现出明显的类别不平衡,遵循长尾分布,某些类别的标注数量极少,如被囊动物 Cnemidocarpa verrucosa 仅有10个标注。数据集还展示了生物大小的显著差异,平均边界框面积从杯珊瑚的520像素²到被囊动物 Distaplia 的68,092像素²不等。这些特点使得 WSBD 成为一个具有挑战性的生态学基准数据集。
使用方法
WSBD 数据集的使用方法包括图像分块处理、空间数据增强和模型微调。由于图像分辨率高,直接处理会导致计算资源不足,因此采用分块策略将大图像划分为500×500像素的子图像,并通过滑动窗口进行重叠处理。数据增强策略主要采用空间变换,以增加训练数据的多样性。模型训练采用预训练的物体检测架构,如 Faster R-CNN 和 Deformable-DETR,并通过微调提升性能。推断后,通过非最大合并 (NMM) 方法将分块检测结果映射回原始图像坐标,以消除重复检测。数据集适用于生物多样性监测、生态学研究和计算机视觉算法的开发。
背景与挑战
背景概述
Weddell Sea Benthic Dataset (WSBD) 是由英国南极调查局和剑桥大学的研究团队于2025年创建的南极海底生物多样性监测数据集。该数据集旨在通过高分辨率原位图像自动检测和分类南极底栖生物,以解决传统人工标注效率低下、难以大规模分析的问题。WSBD包含100张高分辨率图像,覆盖25种形态各异的底栖生物类别,为南极底栖生态系统的研究提供了重要数据支持。该数据集的发布填补了南极底栖生物计算机视觉数据集的空白,对极地生态保护和气候变化研究具有重要意义。
当前挑战
WSBD面临的挑战主要包括两方面:领域问题挑战和构建过程挑战。在领域问题方面,数据集需解决南极底栖生物多样性监测中的小目标检测难题,尤其是对稀有和小型生物的识别;同时还需应对海底复杂背景、光照不均和生物重叠等干扰因素。在构建过程中,研究人员需克服南极数据采集的高成本和地理隔离问题,处理图像中因拍摄高度变化导致的尺度不一致问题,以及解决类别不平衡和标注一致性等数据质量问题。此外,高分辨率图像带来的计算负担和现有目标检测架构对小目标的识别局限也是重要挑战。
常用场景
经典使用场景
Weddell Sea Benthic Dataset (WSBD) 作为首个公开的南极底栖生物计算机视觉数据集,其经典使用场景聚焦于高分辨率拖曳相机图像中底栖生物的自动化检测与分类研究。该数据集通过提供25种形态学细分类别的标注数据,支持开发基于深度学习的对象检测框架,尤其适用于处理海洋生态图像中常见的复杂背景、小目标检测及类间尺寸差异等挑战。其典型应用包括评估SAHI(切片辅助超推理)等新型算法在保留空间分辨率的同时提升小目标检测性能的效果。
实际应用
在实际生态监测中,WSBD支撑的自动化框架已应用于南极科考数据的首轮标注筛选。通过结合SAHI方法和变形DETR架构,该系统能以68.71%的训练集比例实现中等和大型底栖生物的可靠检测(mAP@0.5达0.39),使生态学家能集中精力复核模型输出而非全图标注。这种人类参与循环(human-in-the-loop)的工作流程,显著加速了对积压科考影像的分析进程,在威德尔海生态系统长期监测项目中实现了约8小时/图像的时间成本节约。
衍生相关工作
WSBD催生了多项极地生物检测的延伸研究:1)基于Deformable-DETR的跨平台迁移学习框架,将模型适应性扩展至罗斯海等新区域;2)结合主动学习的迭代标注系统,通过优先级排序优化稀有类群(如仅10个样本的Cnemidocarpa verrucosa海鞘)的检测性能;3)与OBSEA海底观测网络合作开发的实时监测管道,实现了对底栖群落动态的连续追踪。这些工作共同推动了计算机视觉在极端环境生态研究中的应用边界。
以上内容由遇见数据集搜集并总结生成



