five

WSDataset

收藏
github2025-12-15 更新2025-12-27 收录
下载链接:
https://github.com/WSiqiqi/WSDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库包含用于鲸鱼检测的卫星图像样本数据,采用YOLO格式。数据来源于Cubaynes和Fretwell的论文,覆盖了座头鲸、长须鲸、灰鲸和南露脊鲸等多种鲸鱼物种,卫星图像来源包括WorldView-3、WorldView-2、GeoEye-1和Quickbird-2。数据集结构包括训练、验证和测试集的图像和标注文件,图像格式为PNG,标注格式为TXT(YOLO格式)。数据集遵循CC BY 4.0许可。

This repository contains sample satellite image datasets for whale detection, formatted in accordance with the YOLO annotation standard. The dataset is sourced from the peer-reviewed papers authored by Cubaynes and Fretwell, and covers multiple whale species including humpback whales, fin whales, gray whales, and southern right whales. The satellite imagery used originates from platforms including WorldView-3, WorldView-2, GeoEye-1, and Quickbird-2. The dataset is organized into training, validation, and test splits, with corresponding image and annotation files for each split: all images are stored in PNG format, while annotations are saved in TXT files complying with the YOLO specification. This dataset is licensed under CC BY 4.0.
创建时间:
2025-12-15
原始信息汇总

WSDataset (Sample) 数据集概述

数据集基本信息

  • 数据集名称:WSDataset (Sample)
  • 核心内容:用于从卫星图像中检测鲸鱼的YOLO格式样本数据。
  • 重要说明:此仓库仅包含用于演示和学习目的的样本数据。

数据来源与背景

  • 来源论文:Cubaynes, H.C., Fretwell, P.T. "Whales from space dataset, an annotated satellite image dataset of whales for training machine learning models." Scientific Data 9, 245 (2022).
  • 原始数据集物种覆盖:座头鲸、长须鲸、灰鲸、南露脊鲸。
  • 原始卫星图像来源:WorldView-3, WorldView-2, GeoEye-1, Quickbird-2。
  • 许可证:遵循原始数据集的 CC BY 4.0 许可。

数据集结构

数据集目录结构如下:

WS/ ├── images/ │ ├── train/ # 训练样本 (14张图像) │ ├── val/ # 验证样本 (2张图像) │ └── test/ # 测试样本 (4张图像) └── labels/ ├── train/ # 训练标注 (14个文件) ├── val/ # 验证标注 (2个文件) └── test/ # 测试标注 (4个文件)

文件格式与内容

  • 图像格式:PNG。
  • 标注格式:TXT (YOLO格式)。
  • 坐标格式:归一化边界框 (class x_center y_center width height)。所有坐标值归一化到 [0, 1] 范围。
  • 样本文件位置
    • images/train/ - 训练样本图像。
    • images/val/ - 验证样本图像。
    • images/test/ - 测试样本图像。
    • labels/ - 对应的YOLO格式标注文件。

使用方式

YOLO格式训练

可用于熟悉YOLO模型训练流程,示例data.yaml配置如下: yaml train: ./images/train val: ./images/val test: ./images/test nc: 1 # 类别数量 names: [whale] # 类别名称

标注文件格式

每个标注文件(.txt)包含图像中所有目标的边界框信息,每行格式为:

class_id x_center y_center width height

使用要求与许可

  • 署名:使用时需引用原始论文。
  • 学术用途:推荐仅用于学术研究和学习。
  • 版权:原始卫星图像的版权归数据提供商所有。
  • 许可证:CC BY 4.0。

引用

若使用此数据集,请同时引用原始论文和此仓库: bibtex @article{cubaynes2022whales, title={Whales from space dataset, an annotated satellite image dataset of whales for training machine learning models}, author={Cubaynes, Hannah C and Fretwell, Peter T}, journal={Scientific Data}, volume={9}, number={1}, pages={245}, year={2022}, publisher={Nature Publishing Group UK London}, doi={10.1038/s41597-022-01377-4} }

bibtex @article{WANG2025130778, title = {Whale Identification and Size Estimation in Satellite Imagery via Intelligent Subtle Perception}, journal = {Expert Systems with Applications}, pages = {130778}, year = {2025}, issn = {0957-4174}, doi = {https://doi.org/10.1016/j.eswa.2025.130778}, url = {https://www.sciencedirect.com/science/article/pii/S0957417425043933}, author = {Siqi Wang and Baoxiang Huang and Milena Radenkovic and Ge Chen}, }

免责声明

此仓库包含个人整理的样本数据,仅用于学习和演示。如需使用完整数据集,请参考原始论文中的数据可用性声明。

搜集汇总
数据集介绍
main_image_url
构建方式
在海洋生态监测领域,卫星遥感技术为鲸类种群动态研究提供了前所未有的宏观视角。WSDataset的构建源于一项系统性科研工作,其原始数据采集自多颗高分辨率商业卫星,包括WorldView-3、WorldView-2等,覆盖了座头鲸、长须鲸等多个物种的遥感影像。研究人员通过人工目视解译与专业标注,在图像中精确勾勒出鲸体的边界框,并将标注信息转化为YOLO格式的归一化坐标,最终形成结构化的图像与标签对,划分为训练集、验证集与测试集,为算法训练奠定了坚实基础。
特点
该数据集的核心特点在于其专注于鲸类遥感检测的稀缺性与专业性。样本均来源于真实卫星影像,具有高空间分辨率与多光谱信息潜力,能够反映鲸类在海洋环境中的真实形态与分布情境。标注体系采用机器视觉领域通用的YOLO格式,坐标经过归一化处理,确保了与主流检测框架的兼容性。数据已按机器学习流程预先分割为训练、验证与测试子集,极大便利了模型的开发与评估工作,而其遵循的CC BY 4.0许可协议也保障了其在学术研究中的开放性与可及性。
使用方法
对于旨在利用深度学习进行鲸类遥感识别的科研人员而言,该数据集提供了标准化的使用路径。用户需按照YOLO框架的要求组织数据目录,并配置相应的数据描述文件,明确指定训练、验证与测试图像的路径、类别数量及名称。在模型训练过程中,算法将读取TXT格式的标注文件,其中每一行以归一化坐标定义了一个目标边界框。研究者可基于此数据流程,构建和优化目标检测模型,以自动化方式从广阔的海域卫星影像中定位鲸类个体,推动海洋哺乳动物保护与生态学研究的技术进步。
背景与挑战
背景概述
随着遥感技术的飞速发展,卫星影像为海洋哺乳动物的大范围监测提供了前所未有的机遇。在此背景下,由Hannah C. Cubaynes和Peter T. Fretwell等研究人员于2022年创建的WSDataset应运而生,并发表于《Scientific Data》期刊。该数据集旨在通过高分辨率商业卫星影像,系统性地标注座头鲸、长须鲸、灰鲸和南露脊鲸等多种鲸类,以支持机器学习模型在鲸鱼检测任务中的训练与验证。其核心研究问题聚焦于利用自动化方法从复杂海洋背景中精准识别鲸鱼个体,从而推动海洋生态学、保护生物学以及遥感分析领域的交叉融合,为全球鲸类种群动态评估提供了关键的数据基础。
当前挑战
在鲸鱼检测这一具体领域,WSDataset所应对的核心挑战在于从卫星影像中识别出尺寸微小、形态多变且常与海浪、云影及船舶等干扰物混杂的鲸鱼目标,这对模型的细微特征感知与背景噪声抑制能力提出了极高要求。在数据集构建过程中,研究人员亦面临多重困难:高分辨率卫星影像数据获取成本昂贵且覆盖有限;不同物种、个体及成像条件下鲸鱼的外观差异显著,导致标注一致性难以保证;此外,海洋环境的动态变化,如光照条件、海面波纹及云层遮挡,进一步增加了高质量标注的复杂度,使得构建大规模、高精度的基准数据集成为一项艰巨任务。
常用场景
经典使用场景
在海洋生态监测领域,WSDataset为基于卫星影像的鲸类检测提供了标准化的训练与评估基准。该数据集通过高分辨率商业卫星影像,捕捉了座头鲸、长须鲸、灰鲸和南露脊鲸等多类鲸种的形态特征,并以YOLO格式标注了边界框。研究者通常利用该数据集训练深度学习模型,实现从复杂海洋背景中自动识别鲸类个体,为大规模鲸群分布研究奠定数据基础。
衍生相关工作
围绕WSDataset,学术界衍生了一系列经典研究工作。例如,Wang等人(2025)提出了基于智能细微感知的鲸类识别与体型估计方法,通过改进特征提取网络提升了小目标检测精度。此外,许多研究利用该数据集探索了多尺度特征融合、数据增强策略在遥感目标检测中的应用,推动了轻量化模型与跨传感器泛化能力的发展,为后续更大规模的海洋哺乳动物卫星监测数据集构建提供了方法论借鉴。
数据集最近研究
最新研究方向
在海洋生物遥感监测领域,WSDataset作为首个公开的卫星影像鲸类检测数据集,正推动基于深度学习的鲸群智能监测技术发展。前沿研究聚焦于利用高分辨率商业卫星影像,结合YOLO等先进目标检测模型,实现多物种鲸类的自动识别与定位。近期,学者们进一步探索通过智能细微感知方法,从卫星影像中估算鲸鱼个体尺寸,为种群动态与生态评估提供关键参数。这一方向不仅响应了全球鲸类保护与生物多样性监测的迫切需求,也为遥感生态学与计算机视觉的交叉融合开辟了新路径,具有显著的科研与应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作