ARG-NCTU/Boat_dataset_2024

Name: ARG-NCTU/Boat_dataset_2024
Creator: ARG-NCTU
Published: 2024-06-01 05:53:56
License: 暂无描述

Hugging Face2024-06-01 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/ARG-NCTU/Boat_dataset_2024

下载链接

链接失效反馈

官方服务：

资源简介：

--- viewer: false --- # Boat Dataset for Object Detection ## Overview This dataset contains images of real & virtual boats for object detection tasks. It can be used to train and evaluate object detection models. ## Dataset Structure ### Data Instances A data point comprises an image and its object annotations. ``` ``` ### Data Fields - `image_id`: the image id - `width`: the image width - `height`: the image height - `objects`: a dictionary containing bounding box metadata for the objects present on the image - `id`: the annotation id - `area`: the area of the bounding box - `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format) - `category`: the object's category, with possible values including - `BallonBoat` (0) - `BigBoat` (1) - `Boat` (2) - `JetSki` (3) - `Katamaran` (4) - `SailBoat` (5) - `SmallBoat` (6) - `SpeedBoat` (7) - `WAM_V` (8) ### Data Splits - `Training dataset` (42833) - `Real` - `WAM_V` (2333) - `Virtual` - `BallonBoat` (4500) - `BigBoat` (4500) - `Boat` (4500) - `JetSki` (4500) - `Katamaran` (4500) - `SailBoat` (4500) - `SmallBoat` (4500) - `SpeedBoat` (4500) - `WAM_V` (4500) - `Val dataset` (5400) - `Real` - `WAM_V` (900) - `Virtual` - `BallonBoat` (500) - `BigBoat` (500) - `Boat` (500) - `JetSki` (500) - `Katamaran` (500) - `SailBoat` (500) - `SmallBoat` (500) - `SpeedBoat` (500) - `WAM_V` (500) ## Usage ``` from datasets import load_dataset dataset = load_dataset("zhuchi76/Boat_dataset") ``` ## Citation If you use this dataset in your research, please cite the following paper:

查看器：禁用 # 用于目标检测的船舶数据集 ## 数据集概述本数据集包含适用于目标检测任务的真实与虚拟船舶图像，可用于训练与评估各类目标检测模型。 ## 数据集结构 ### 数据实例每个数据点由一幅图像及其对应的目标标注组成。 ### 数据字段 - `image_id`：图像唯一标识符 - `width`：图像宽度 - `height`：图像高度 - `objects`：存储图像中目标边界框元数据的字典 - `id`：标注唯一标识符 - `area`：边界框的面积 - `bbox`：目标边界框，采用COCO（Common Objects in Context，通用物体检测基准）格式，格式说明详见：https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco - `category`：目标类别，可选取值包括： - `BallonBoat`（0）：气球船 - `BigBoat`（1）：大型船舶 - `Boat`（2）：通用船舶 - `JetSki`（3）：水上摩托 - `Katamaran`（4）：双体船 - `SailBoat`（5）：帆船 - `SmallBoat`（6）：小型船舶 - `SpeedBoat`（7）：快艇 - `WAM_V`（8）：WAM_V ### 数据划分 - 训练集（共42833条样本） - 真实场景子集： - WAM_V：2333条 - 虚拟场景子集： - 气球船（BallonBoat）：4500条 - 大型船舶（BigBoat）：4500条 - 通用船舶（Boat）：4500条 - 水上摩托（JetSki）：4500条 - 双体船（Katamaran）：4500条 - 帆船（SailBoat）：4500条 - 小型船舶（SmallBoat）：4500条 - 快艇（SpeedBoat）：4500条 - WAM_V：4500条 - 验证集（共5400条样本） - 真实场景子集： - WAM_V：900条 - 虚拟场景子集： - 气球船（BallonBoat）：500条 - 大型船舶（BigBoat）：500条 - 通用船舶（Boat）：500条 - 水上摩托（JetSki）：500条 - 双体船（Katamaran）：500条 - 帆船（SailBoat）：500条 - 小型船舶（SmallBoat）：500条 - 快艇（SpeedBoat）：500条 - WAM_V：500条 ## 使用方法 python from datasets import load_dataset dataset = load_dataset("zhuchi76/Boat_dataset") ## 引用说明若您在研究中使用本数据集，请引用如下论文：

提供机构：

ARG-NCTU

原始信息汇总

Boat Dataset for Object Detection 概述

数据集结构

数据实例

每个数据点包括一张图像及其对象标注。

数据字段

image_id: 图像ID
width: 图像宽度
height: 图像高度
objects: 包含图像中对象边界框元数据的字典
- id: 标注ID
- area: 边界框面积
- bbox: 对象的边界框（采用coco格式）
- category: 对象类别，可能的值包括：
  - BallonBoat (0)
  - BigBoat (1)
  - Boat (2)
  - JetSki (3)
  - Katamaran (4)
  - SailBoat (5)
  - SmallBoat (6)
  - SpeedBoat (7)
  - WAM_V (8)

数据分割

训练数据集 (42833)
- 真实
  - WAM_V (2333)
- 虚拟
  - BallonBoat (4500)
  - BigBoat (4500)
  - Boat (4500)
  - JetSki (4500)
  - Katamaran (4500)
  - SailBoat (4500)
  - SmallBoat (4500)
  - SpeedBoat (4500)
  - WAM_V (4500)
验证数据集 (5400)
- 真实
  - WAM_V (900)
- 虚拟
  - BallonBoat (500)
  - BigBoat (500)
  - Boat (500)
  - JetSki (500)
  - Katamaran (500)
  - SailBoat (500)
  - SmallBoat (500)
  - SpeedBoat (500)
  - WAM_V (500)

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，目标检测任务对高质量标注数据的需求日益增长。ARG-NCTU/Boat_dataset_2024 数据集的构建采用了虚实结合的策略，通过整合真实场景采集的RGB图像与虚拟环境生成的RGB及热成像数据，形成了多元化的数据来源。其构建过程严格遵循结构化标注流程，每张图像均配有详细的边界框元数据，并采用COCO格式进行标准化处理，确保了标注的一致性与可复用性。数据划分上，该数据集以约8:2的比例分割为训练集与验证集，涵盖了超过11万张图像与50万个标注实例，为模型训练提供了充足的样本支持。

特点

该数据集在海洋目标检测领域展现出鲜明的特色。其核心优势在于融合了真实与虚拟、RGB与热成像的多模态数据，通过六种不同的数据组合后缀（如rtvrr、rvrr等）提供了灵活的数据子集选择。数据集定义了13类精细的船只类别，包括气球船、大型船只、喷气式滑水车、双体船、帆船等，覆盖了广泛的船舶类型。数据分布呈现出虚拟数据占主导、真实数据集中于特定类别的特点，这种构成有助于研究域适应与模型泛化能力。平均每张图像包含约4.5个标注，反映了真实场景中多目标并存的复杂性。

使用方法

为有效利用该数据集进行目标检测研究，用户可通过Hugging Face的datasets库便捷加载。加载时需预先定义与数据结构匹配的特征模式，明确指定image_id、image_path、图像尺寸及包含边界框与类别的objects字典等字段的数据类型。通过调用load_dataset函数并传入对应的JSONL文件路径，即可加载如rtvrr等特定数据组合的训练集与验证集。这种标准化加载方式不仅简化了数据预处理流程，还确保了与主流深度学习框架的兼容性，便于研究者快速构建和评估目标检测模型，推动海洋场景感知技术的进展。

背景与挑战

背景概述

ARG-NCTU/Boat_dataset_2024 数据集由国立阳明交通大学（NCTU）的研究团队于2024年构建，专注于海事环境中的目标检测任务。该数据集整合了真实与虚拟船只图像，涵盖13类船舶目标，包括帆船、游艇、集装箱船等，旨在推动计算机视觉在海洋监控、自动驾驶船舶等领域的应用。通过融合RGB与热成像模态，数据集为多光谱目标检测提供了丰富资源，其大规模标注数据（超过50万标注实例）显著提升了模型在复杂海况下的泛化能力，对海事安全与智能航运研究具有重要价值。

当前挑战

该数据集致力于解决海事目标检测中因环境多变、目标尺度差异及遮挡导致的识别精度不足问题。构建过程中，挑战主要体现在多源数据融合的复杂性：虚拟与真实图像间的域差异可能影响模型迁移效果；热成像与RGB数据的对齐需精确校准技术；此外，类别不平衡（如某些类别样本稀缺）及标注一致性维护也增加了数据集构建的难度，要求精细的标注策略与质量控制。

常用场景

经典使用场景

在海洋视觉感知领域，ARG-NCTU/Boat_dataset_2024数据集为对象检测任务提供了丰富的图像资源。该数据集整合了真实与虚拟船只图像，涵盖13类船舶目标，其经典应用场景在于训练和评估基于深度学习的对象检测模型，如YOLO、Faster R-CNN等。通过包含RGB与热成像模态数据，它支持模型在多源信息融合下的性能验证，尤其适用于复杂海况下小型船只的精准识别与定位研究。

衍生相关工作

围绕该数据集，学术界已衍生出多项经典研究工作。例如，基于其多模态特性开展的虚拟到真实域适应研究，显著提升了模型在真实海况的泛化能力；结合热成像与RGB数据的融合检测框架，也被广泛引用于跨传感器目标识别领域。这些工作不仅优化了船舶检测的精度与效率，也为合成数据在视觉任务中的有效性验证设立了重要基准。

数据集最近研究