cots_yolo_dataset
收藏Hugging Face2025-08-09 更新2025-08-10 收录
下载链接:
https://huggingface.co/datasets/eloise54/cots_yolo_dataset
下载链接
链接失效反馈官方服务:
资源简介:
CSIRO Crown-of-Thorns Starfish (COTS) Detection Dataset是CSIRO COTS和COTS Scars数据集的修改版本,用于珊瑚礁监测和控制,特别是针对大堡礁。这个数据集已经转换为YOLO格式,并包含训练集、验证集和测试集。它专注于COTS( Crown-of-Thorns Starfish)的检测,不包括COTS疤痕的注释。
创建时间:
2025-08-07
原始信息汇总
CSIRO Crown-of-Thorns Starfish (COTS) Detection Dataset — YOLO Format
基本信息
- 许可证: Creative Commons Attribution 4.0 License (CC BY 4.0)
- 任务类别: 目标检测
- 标签: 生物学
- 数据集名称: CSIRO Crown-of-Thorns Starfish (COTS) Detection Dataset — YOLO Format
- 数据规模: 小于1K样本
数据集来源
- 原始数据集: CSIRO COTS and COTS Scars Dataset
- 原始数据集作者: Armin, Ali 等
- 原始数据集发布年份: 2024
- 原始数据集DOI: 10.25919/03a7-hn83
数据集描述
- 内容: 包含用于检测**长棘海星(COTS)**的图像和标注,支持大堡礁(GBR)的珊瑚礁监测和控制工作。
- 重要性: 长棘海星是珊瑚捕食者,其爆发可能严重破坏珊瑚礁生态系统。
修改内容
-
标注格式: 转换为YOLO格式
-
数据划分: 仅使用带有COTS标签的图像创建了训练集/验证集,保留了原始测试集
-
标注处理: 移除了所有COTS疤痕的标注
-
目录结构:
cots_yolo_dataset/ ├── images/ │ ├── train/ │ ├── val/ │ └── test/ ├── labels/ │ ├── train/ │ ├── val/ │ └── test/ └── cots_yolo_dataset.yaml
使用示例
-
训练: python from ultralytics import YOLO model = YOLO(yolo11m.pt) results = model.train(data=data/cots_yolo_dataset/cots_yolo_dataset.yaml, epochs=20, task=detect)
-
推理: 参考GitLab Notebook
相关资源
- Hugging Face Spaces演示: COTS Detection Project
- GitLab仓库: COTS Detection Project Repository
搜集汇总
数据集介绍

构建方式
在珊瑚礁生态监测领域,CSIRO棘冠海星检测数据集经过专业重构,原始数据来自大堡礁实地采集的生态影像。该版本通过精细化处理,将标注格式转换为YOLO标准,剔除了与疤痕相关的冗余标注,并依据检测任务需求重新划分了训练集与验证集。数据集架构采用模块化设计,图像与标签文件按功能分区存储,配套的YAML配置文件确保了与主流检测框架的无缝对接。
特点
作为针对海洋生物检测的专项数据集,其核心价值体现在三个方面:精选的样本均包含棘冠海星实体标注,保障了目标检测任务的纯净性;采用YOLO格式标准化处理,显著降低了算法适配的工程复杂度;保留原始测试集的策略,为模型评估提供了可靠的基准参照。数据集的轻量化特性使其特别适合迁移学习研究,同时保持了对珊瑚礁生态监测场景的高度代表性。
使用方法
该数据集与Ultralytics框架深度适配,用户通过简单的命令行操作即可完成环境部署。典型工作流包含三个关键环节:克隆仓库获取结构化数据,加载预训练模型参数,通过配置文件启动训练流程。对于快速验证场景,项目提供的Jupyter notebook支持远程推理演示,无需下载完整数据集即可体验检测效果。这种设计既满足了本地训练的灵活性,又提供了云端验证的便捷性。
背景与挑战
背景概述
由澳大利亚联邦科学与工业研究组织(CSIRO)于2024年发布的COTS目标检测数据集,聚焦于大堡礁生态系统中棘冠海星(Crown-of-Thorns Starfish, COTS)的监测与识别研究。作为珊瑚礁的主要捕食者,棘冠海星种群爆发会对海洋生态系统造成严重破坏。该数据集通过标准化标注的视觉数据,为珊瑚礁保护提供了关键的技术支持,其YOLO格式的转换进一步推动了实时检测算法在海洋生态保护中的应用。
当前挑战
该数据集面临的核心挑战体现在两个维度:在领域问题层面,水下环境的复杂光照条件、珊瑚背景干扰以及目标生物形态多样性,对检测模型的鲁棒性提出了极高要求;在数据构建层面,原始数据中棘冠海星与疤痕标注的混合特性需进行精细化清洗,而YOLO格式转换过程中的坐标系统转换、训练验证集划分等工程化处理,亦需保持标注空间一致性与数据分布平衡性。
常用场景
经典使用场景
在珊瑚礁生态监测领域,cots_yolo_dataset数据集为研究人员提供了高效的检测工具。该数据集专门针对棘冠海星(COTS)这一关键物种,其YOLO格式的标注特性使其成为目标检测模型快速部署的理想选择。通过优化后的训练集、验证集划分,研究者能够直接应用于YOLOv11m等先进算法的微调,大幅提升珊瑚礁生态系统中生物入侵监测的自动化水平。
解决学术问题
该数据集有效解决了海洋生态学中棘冠海星种群动态监测的算法瓶颈问题。传统人工普查方式受限于水下作业环境,而通过计算机视觉技术可实现大面积、高频次的种群数量评估。数据集剔除了疤痕标注等干扰因素,专注于活体检测任务,为建立珊瑚礁生态健康预警系统提供了标准化的算法验证基准。其标注规范更推动了小样本水下目标检测这一前沿课题的发展。
衍生相关工作
基于该数据集衍生的研究推动了多项创新工作,包括轻量化水下目标检测网络架构的优化、低照度环境下生物特征增强算法等。GitLab公开的训练管道更成为后续研究的基准框架,相关成果已应用于澳大利亚海洋科学研究所的珊瑚礁健康评估系统。数据集的标准格式也促进了跨机构研究的数据共享与算法比对。
以上内容由遇见数据集搜集并总结生成



