five

ARG-NCTU/Boat_dataset_2024

收藏
Hugging Face2024-06-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ARG-NCTU/Boat_dataset_2024
下载链接
链接失效反馈
官方服务:
资源简介:
--- viewer: false --- # Boat Dataset for Object Detection ## Overview This dataset contains images of real & virtual boats for object detection tasks. It can be used to train and evaluate object detection models. ## Dataset Structure ### Data Instances A data point comprises an image and its object annotations. ``` ``` ### Data Fields - `image_id`: the image id - `width`: the image width - `height`: the image height - `objects`: a dictionary containing bounding box metadata for the objects present on the image - `id`: the annotation id - `area`: the area of the bounding box - `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format) - `category`: the object's category, with possible values including - `BallonBoat` (0) - `BigBoat` (1) - `Boat` (2) - `JetSki` (3) - `Katamaran` (4) - `SailBoat` (5) - `SmallBoat` (6) - `SpeedBoat` (7) - `WAM_V` (8) ### Data Splits - `Training dataset` (42833) - `Real` - `WAM_V` (2333) - `Virtual` - `BallonBoat` (4500) - `BigBoat` (4500) - `Boat` (4500) - `JetSki` (4500) - `Katamaran` (4500) - `SailBoat` (4500) - `SmallBoat` (4500) - `SpeedBoat` (4500) - `WAM_V` (4500) - `Val dataset` (5400) - `Real` - `WAM_V` (900) - `Virtual` - `BallonBoat` (500) - `BigBoat` (500) - `Boat` (500) - `JetSki` (500) - `Katamaran` (500) - `SailBoat` (500) - `SmallBoat` (500) - `SpeedBoat` (500) - `WAM_V` (500) ## Usage ``` from datasets import load_dataset dataset = load_dataset("zhuchi76/Boat_dataset") ``` ## Citation If you use this dataset in your research, please cite the following paper:

查看器:禁用 # 用于目标检测的船舶数据集 ## 数据集概述 本数据集包含适用于目标检测任务的真实与虚拟船舶图像,可用于训练与评估各类目标检测模型。 ## 数据集结构 ### 数据实例 每个数据点由一幅图像及其对应的目标标注组成。 ### 数据字段 - `image_id`:图像唯一标识符 - `width`:图像宽度 - `height`:图像高度 - `objects`:存储图像中目标边界框元数据的字典 - `id`:标注唯一标识符 - `area`:边界框的面积 - `bbox`:目标边界框,采用COCO(Common Objects in Context,通用物体检测基准)格式,格式说明详见:https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco - `category`:目标类别,可选取值包括: - `BallonBoat`(0):气球船 - `BigBoat`(1):大型船舶 - `Boat`(2):通用船舶 - `JetSki`(3):水上摩托 - `Katamaran`(4):双体船 - `SailBoat`(5):帆船 - `SmallBoat`(6):小型船舶 - `SpeedBoat`(7):快艇 - `WAM_V`(8):WAM_V ### 数据划分 - 训练集(共42833条样本) - 真实场景子集: - WAM_V:2333条 - 虚拟场景子集: - 气球船(BallonBoat):4500条 - 大型船舶(BigBoat):4500条 - 通用船舶(Boat):4500条 - 水上摩托(JetSki):4500条 - 双体船(Katamaran):4500条 - 帆船(SailBoat):4500条 - 小型船舶(SmallBoat):4500条 - 快艇(SpeedBoat):4500条 - WAM_V:4500条 - 验证集(共5400条样本) - 真实场景子集: - WAM_V:900条 - 虚拟场景子集: - 气球船(BallonBoat):500条 - 大型船舶(BigBoat):500条 - 通用船舶(Boat):500条 - 水上摩托(JetSki):500条 - 双体船(Katamaran):500条 - 帆船(SailBoat):500条 - 小型船舶(SmallBoat):500条 - 快艇(SpeedBoat):500条 - WAM_V:500条 ## 使用方法 python from datasets import load_dataset dataset = load_dataset("zhuchi76/Boat_dataset") ## 引用说明 若您在研究中使用本数据集,请引用如下论文:
提供机构:
ARG-NCTU
原始信息汇总

Boat Dataset for Object Detection 概述

数据集结构

数据实例

每个数据点包括一张图像及其对象标注。

数据字段

  • image_id: 图像ID
  • width: 图像宽度
  • height: 图像高度
  • objects: 包含图像中对象边界框元数据的字典
    • id: 标注ID
    • area: 边界框面积
    • bbox: 对象的边界框(采用coco格式)
    • category: 对象类别,可能的值包括:
      • BallonBoat (0)
      • BigBoat (1)
      • Boat (2)
      • JetSki (3)
      • Katamaran (4)
      • SailBoat (5)
      • SmallBoat (6)
      • SpeedBoat (7)
      • WAM_V (8)

数据分割

  • 训练数据集 (42833)

    • 真实
      • WAM_V (2333)
    • 虚拟
      • BallonBoat (4500)
      • BigBoat (4500)
      • Boat (4500)
      • JetSki (4500)
      • Katamaran (4500)
      • SailBoat (4500)
      • SmallBoat (4500)
      • SpeedBoat (4500)
      • WAM_V (4500)
  • 验证数据集 (5400)

    • 真实
      • WAM_V (900)
    • 虚拟
      • BallonBoat (500)
      • BigBoat (500)
      • Boat (500)
      • JetSki (500)
      • Katamaran (500)
      • SailBoat (500)
      • SmallBoat (500)
      • SpeedBoat (500)
      • WAM_V (500)
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,目标检测任务对高质量标注数据的需求日益增长。ARG-NCTU/Boat_dataset_2024 数据集的构建采用了虚实结合的策略,通过整合真实场景采集的RGB图像与虚拟环境生成的RGB及热成像数据,形成了多元化的数据来源。其构建过程严格遵循结构化标注流程,每张图像均配有详细的边界框元数据,并采用COCO格式进行标准化处理,确保了标注的一致性与可复用性。数据划分上,该数据集以约8:2的比例分割为训练集与验证集,涵盖了超过11万张图像与50万个标注实例,为模型训练提供了充足的样本支持。
特点
该数据集在海洋目标检测领域展现出鲜明的特色。其核心优势在于融合了真实与虚拟、RGB与热成像的多模态数据,通过六种不同的数据组合后缀(如rtvrr、rvrr等)提供了灵活的数据子集选择。数据集定义了13类精细的船只类别,包括气球船、大型船只、喷气式滑水车、双体船、帆船等,覆盖了广泛的船舶类型。数据分布呈现出虚拟数据占主导、真实数据集中于特定类别的特点,这种构成有助于研究域适应与模型泛化能力。平均每张图像包含约4.5个标注,反映了真实场景中多目标并存的复杂性。
使用方法
为有效利用该数据集进行目标检测研究,用户可通过Hugging Face的datasets库便捷加载。加载时需预先定义与数据结构匹配的特征模式,明确指定image_id、image_path、图像尺寸及包含边界框与类别的objects字典等字段的数据类型。通过调用load_dataset函数并传入对应的JSONL文件路径,即可加载如rtvrr等特定数据组合的训练集与验证集。这种标准化加载方式不仅简化了数据预处理流程,还确保了与主流深度学习框架的兼容性,便于研究者快速构建和评估目标检测模型,推动海洋场景感知技术的进展。
背景与挑战
背景概述
ARG-NCTU/Boat_dataset_2024 数据集由国立阳明交通大学(NCTU)的研究团队于2024年构建,专注于海事环境中的目标检测任务。该数据集整合了真实与虚拟船只图像,涵盖13类船舶目标,包括帆船、游艇、集装箱船等,旨在推动计算机视觉在海洋监控、自动驾驶船舶等领域的应用。通过融合RGB与热成像模态,数据集为多光谱目标检测提供了丰富资源,其大规模标注数据(超过50万标注实例)显著提升了模型在复杂海况下的泛化能力,对海事安全与智能航运研究具有重要价值。
当前挑战
该数据集致力于解决海事目标检测中因环境多变、目标尺度差异及遮挡导致的识别精度不足问题。构建过程中,挑战主要体现在多源数据融合的复杂性:虚拟与真实图像间的域差异可能影响模型迁移效果;热成像与RGB数据的对齐需精确校准技术;此外,类别不平衡(如某些类别样本稀缺)及标注一致性维护也增加了数据集构建的难度,要求精细的标注策略与质量控制。
常用场景
经典使用场景
在海洋视觉感知领域,ARG-NCTU/Boat_dataset_2024数据集为对象检测任务提供了丰富的图像资源。该数据集整合了真实与虚拟船只图像,涵盖13类船舶目标,其经典应用场景在于训练和评估基于深度学习的对象检测模型,如YOLO、Faster R-CNN等。通过包含RGB与热成像模态数据,它支持模型在多源信息融合下的性能验证,尤其适用于复杂海况下小型船只的精准识别与定位研究。
衍生相关工作
围绕该数据集,学术界已衍生出多项经典研究工作。例如,基于其多模态特性开展的虚拟到真实域适应研究,显著提升了模型在真实海况的泛化能力;结合热成像与RGB数据的融合检测框架,也被广泛引用于跨传感器目标识别领域。这些工作不仅优化了船舶检测的精度与效率,也为合成数据在视觉任务中的有效性验证设立了重要基准。
数据集最近研究
最新研究方向
在海洋智能感知领域,ARG-NCTU/Boat_dataset_2024数据集凭借其融合真实与虚拟船只图像的多模态特性,正成为推动目标检测技术前沿探索的关键资源。该数据集涵盖RGB与热成像数据,为模型在复杂海况下的鲁棒性研究提供了丰富素材,尤其助力于跨模态学习与域自适应方法的创新。随着自动驾驶船舶与海上监控系统的快速发展,此类数据集在提升模型对多样化船只类别的识别精度、应对光照与天气变化挑战方面展现出深远影响,为海事安全与智能航运系统的实际部署奠定了坚实的数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作