ARG-NCTU/Boat_dataset_2024
收藏Hugging Face2024-06-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ARG-NCTU/Boat_dataset_2024
下载链接
链接失效反馈官方服务:
资源简介:
---
viewer: false
---
# Boat Dataset for Object Detection
## Overview
This dataset contains images of real & virtual boats for object detection tasks. It can be used to train and evaluate object detection models.
## Dataset Structure
### Data Instances
A data point comprises an image and its object annotations.
```
```
### Data Fields
- `image_id`: the image id
- `width`: the image width
- `height`: the image height
- `objects`: a dictionary containing bounding box metadata for the objects present on the image
- `id`: the annotation id
- `area`: the area of the bounding box
- `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format)
- `category`: the object's category, with possible values including
- `BallonBoat` (0)
- `BigBoat` (1)
- `Boat` (2)
- `JetSki` (3)
- `Katamaran` (4)
- `SailBoat` (5)
- `SmallBoat` (6)
- `SpeedBoat` (7)
- `WAM_V` (8)
### Data Splits
- `Training dataset` (42833)
- `Real`
- `WAM_V` (2333)
- `Virtual`
- `BallonBoat` (4500)
- `BigBoat` (4500)
- `Boat` (4500)
- `JetSki` (4500)
- `Katamaran` (4500)
- `SailBoat` (4500)
- `SmallBoat` (4500)
- `SpeedBoat` (4500)
- `WAM_V` (4500)
- `Val dataset` (5400)
- `Real`
- `WAM_V` (900)
- `Virtual`
- `BallonBoat` (500)
- `BigBoat` (500)
- `Boat` (500)
- `JetSki` (500)
- `Katamaran` (500)
- `SailBoat` (500)
- `SmallBoat` (500)
- `SpeedBoat` (500)
- `WAM_V` (500)
## Usage
```
from datasets import load_dataset
dataset = load_dataset("zhuchi76/Boat_dataset")
```
## Citation
If you use this dataset in your research, please cite the following paper:
查看器:禁用
# 用于目标检测的船舶数据集
## 数据集概述
本数据集包含适用于目标检测任务的真实与虚拟船舶图像,可用于训练与评估各类目标检测模型。
## 数据集结构
### 数据实例
每个数据点由一幅图像及其对应的目标标注组成。
### 数据字段
- `image_id`:图像唯一标识符
- `width`:图像宽度
- `height`:图像高度
- `objects`:存储图像中目标边界框元数据的字典
- `id`:标注唯一标识符
- `area`:边界框的面积
- `bbox`:目标边界框,采用COCO(Common Objects in Context,通用物体检测基准)格式,格式说明详见:https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco
- `category`:目标类别,可选取值包括:
- `BallonBoat`(0):气球船
- `BigBoat`(1):大型船舶
- `Boat`(2):通用船舶
- `JetSki`(3):水上摩托
- `Katamaran`(4):双体船
- `SailBoat`(5):帆船
- `SmallBoat`(6):小型船舶
- `SpeedBoat`(7):快艇
- `WAM_V`(8):WAM_V
### 数据划分
- 训练集(共42833条样本)
- 真实场景子集:
- WAM_V:2333条
- 虚拟场景子集:
- 气球船(BallonBoat):4500条
- 大型船舶(BigBoat):4500条
- 通用船舶(Boat):4500条
- 水上摩托(JetSki):4500条
- 双体船(Katamaran):4500条
- 帆船(SailBoat):4500条
- 小型船舶(SmallBoat):4500条
- 快艇(SpeedBoat):4500条
- WAM_V:4500条
- 验证集(共5400条样本)
- 真实场景子集:
- WAM_V:900条
- 虚拟场景子集:
- 气球船(BallonBoat):500条
- 大型船舶(BigBoat):500条
- 通用船舶(Boat):500条
- 水上摩托(JetSki):500条
- 双体船(Katamaran):500条
- 帆船(SailBoat):500条
- 小型船舶(SmallBoat):500条
- 快艇(SpeedBoat):500条
- WAM_V:500条
## 使用方法
python
from datasets import load_dataset
dataset = load_dataset("zhuchi76/Boat_dataset")
## 引用说明
若您在研究中使用本数据集,请引用如下论文:
提供机构:
ARG-NCTU
原始信息汇总
Boat Dataset for Object Detection 概述
数据集结构
数据实例
每个数据点包括一张图像及其对象标注。
数据字段
image_id: 图像IDwidth: 图像宽度height: 图像高度objects: 包含图像中对象边界框元数据的字典id: 标注IDarea: 边界框面积bbox: 对象的边界框(采用coco格式)category: 对象类别,可能的值包括:BallonBoat(0)BigBoat(1)Boat(2)JetSki(3)Katamaran(4)SailBoat(5)SmallBoat(6)SpeedBoat(7)WAM_V(8)
数据分割
-
训练数据集(42833)真实WAM_V(2333)
虚拟BallonBoat(4500)BigBoat(4500)Boat(4500)JetSki(4500)Katamaran(4500)SailBoat(4500)SmallBoat(4500)SpeedBoat(4500)WAM_V(4500)
-
验证数据集(5400)真实WAM_V(900)
虚拟BallonBoat(500)BigBoat(500)Boat(500)JetSki(500)Katamaran(500)SailBoat(500)SmallBoat(500)SpeedBoat(500)WAM_V(500)
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,目标检测任务对高质量标注数据的需求日益增长。ARG-NCTU/Boat_dataset_2024 数据集的构建采用了虚实结合的策略,通过整合真实场景采集的RGB图像与虚拟环境生成的RGB及热成像数据,形成了多元化的数据来源。其构建过程严格遵循结构化标注流程,每张图像均配有详细的边界框元数据,并采用COCO格式进行标准化处理,确保了标注的一致性与可复用性。数据划分上,该数据集以约8:2的比例分割为训练集与验证集,涵盖了超过11万张图像与50万个标注实例,为模型训练提供了充足的样本支持。
特点
该数据集在海洋目标检测领域展现出鲜明的特色。其核心优势在于融合了真实与虚拟、RGB与热成像的多模态数据,通过六种不同的数据组合后缀(如rtvrr、rvrr等)提供了灵活的数据子集选择。数据集定义了13类精细的船只类别,包括气球船、大型船只、喷气式滑水车、双体船、帆船等,覆盖了广泛的船舶类型。数据分布呈现出虚拟数据占主导、真实数据集中于特定类别的特点,这种构成有助于研究域适应与模型泛化能力。平均每张图像包含约4.5个标注,反映了真实场景中多目标并存的复杂性。
使用方法
为有效利用该数据集进行目标检测研究,用户可通过Hugging Face的datasets库便捷加载。加载时需预先定义与数据结构匹配的特征模式,明确指定image_id、image_path、图像尺寸及包含边界框与类别的objects字典等字段的数据类型。通过调用load_dataset函数并传入对应的JSONL文件路径,即可加载如rtvrr等特定数据组合的训练集与验证集。这种标准化加载方式不仅简化了数据预处理流程,还确保了与主流深度学习框架的兼容性,便于研究者快速构建和评估目标检测模型,推动海洋场景感知技术的进展。
背景与挑战
背景概述
ARG-NCTU/Boat_dataset_2024 数据集由国立阳明交通大学(NCTU)的研究团队于2024年构建,专注于海事环境中的目标检测任务。该数据集整合了真实与虚拟船只图像,涵盖13类船舶目标,包括帆船、游艇、集装箱船等,旨在推动计算机视觉在海洋监控、自动驾驶船舶等领域的应用。通过融合RGB与热成像模态,数据集为多光谱目标检测提供了丰富资源,其大规模标注数据(超过50万标注实例)显著提升了模型在复杂海况下的泛化能力,对海事安全与智能航运研究具有重要价值。
当前挑战
该数据集致力于解决海事目标检测中因环境多变、目标尺度差异及遮挡导致的识别精度不足问题。构建过程中,挑战主要体现在多源数据融合的复杂性:虚拟与真实图像间的域差异可能影响模型迁移效果;热成像与RGB数据的对齐需精确校准技术;此外,类别不平衡(如某些类别样本稀缺)及标注一致性维护也增加了数据集构建的难度,要求精细的标注策略与质量控制。
常用场景
经典使用场景
在海洋视觉感知领域,ARG-NCTU/Boat_dataset_2024数据集为对象检测任务提供了丰富的图像资源。该数据集整合了真实与虚拟船只图像,涵盖13类船舶目标,其经典应用场景在于训练和评估基于深度学习的对象检测模型,如YOLO、Faster R-CNN等。通过包含RGB与热成像模态数据,它支持模型在多源信息融合下的性能验证,尤其适用于复杂海况下小型船只的精准识别与定位研究。
衍生相关工作
围绕该数据集,学术界已衍生出多项经典研究工作。例如,基于其多模态特性开展的虚拟到真实域适应研究,显著提升了模型在真实海况的泛化能力;结合热成像与RGB数据的融合检测框架,也被广泛引用于跨传感器目标识别领域。这些工作不仅优化了船舶检测的精度与效率,也为合成数据在视觉任务中的有效性验证设立了重要基准。
数据集最近研究
最新研究方向
在海洋智能感知领域,ARG-NCTU/Boat_dataset_2024数据集凭借其融合真实与虚拟船只图像的多模态特性,正成为推动目标检测技术前沿探索的关键资源。该数据集涵盖RGB与热成像数据,为模型在复杂海况下的鲁棒性研究提供了丰富素材,尤其助力于跨模态学习与域自适应方法的创新。随着自动驾驶船舶与海上监控系统的快速发展,此类数据集在提升模型对多样化船只类别的识别精度、应对光照与天气变化挑战方面展现出深远影响,为海事安全与智能航运系统的实际部署奠定了坚实的数据基础。
以上内容由遇见数据集搜集并总结生成



