MARVEL

github2024-05-20 更新2024-05-31 收录

下载链接：

https://github.com/avaapm/marveldataset2016

下载链接

链接失效反馈

官方服务：

资源简介：

MARVEL是一个大规模的图像数据集，专门用于海事船舶的识别。该数据集包含了大量的船舶图像，用于支持船舶分类、验证/检索/识别等任务。

MARVEL is a large-scale image dataset specifically designed for maritime vessel recognition. This dataset encompasses a vast collection of ship images, aimed at supporting tasks such as vessel classification, verification, retrieval, and identification.

创建时间：

2016-09-26

原始信息汇总

数据集概述

数据集名称

名称: MARVEL dataset 2016

数据集用途

用途: 用于海事船舶的大规模图像数据集，支持船舶分类、验证、检索和识别等任务。

数据集内容

分类: 包含多个.dat文件，用于不同的任务：
- Vessel Classification: 使用VesselClassification.dat文件，每行包含船舶ID、集合索引、类别标签和类别标签名称。
- IMO Training and Test Sets: 使用IMOTrainAndTest.dat文件，每行包含船舶ID、集合索引、类别标签、类别标签名称和IMO编号。
- Vessel Verification: 使用VesselVerificationTest.dat和VesselVerificationTrain.dat文件，每行包含船舶索引1、船舶索引2和集合索引。
- Vessel Retrieval: 使用ChiTest.dat, ChiTrain.dat, EucTest.dat, EucTrain.dat文件，每行包含船舶索引、类别标签和类别名称。
- Vessel Recognition: 使用名为Recognition的文件夹，包含29个船舶类型的文件夹，每个文件夹包含五个不同的训练和测试折叠。

数据集下载与使用

下载: 通过运行MARVEL_Download.py Python脚本下载数据集，需选择相应的.dat文件。
参数设置: 脚本中包含多个参数，如NUMBER_OF_WORKERS, MAX_NUM_OF_FILES_IN_FOLDER, IMAGE_HEIGHT, IMAGE_WIDTH, ORIGINAL_SIZE, JUST_IMAGE。
文件结构: 下载的图像分布在元文件夹结构中，输出文件名为FINAL.dat，包含图像的完整路径。

引用信息

引用: 如在研究中使用此数据集，请引用以下出版物：

@PROCEEDINGS {MARVEL, author = "Gundogdu E., Solmaz B, Yucesoy V., Koc A.", title = "Marvel: A Large-Scale Image Dataset for Maritime Vessels", year = "2016", organization = "Asian Conference on Computer Vision (ACCV)" }

搜集汇总

数据集介绍

构建方式

MARVEL数据集的构建基于大规模的海洋船舶图像，涵盖了多种船舶类型和任务场景。数据集通过从特定网站下载图像，并使用Python脚本进行自动化处理，确保了数据的高效获取和整理。图像数据被组织成特定的文件结构，并附带详细的元数据文件，如船舶ID、类别标签、IMO编号等，以便于不同任务的训练和测试。

特点

MARVEL数据集的显著特点在于其大规模性和多样性，包含超过40万张图像，涵盖26种船舶类型。数据集不仅支持船舶分类任务，还提供了船舶验证、检索和识别等多种任务的数据支持。此外，数据集的元数据文件结构清晰，便于研究人员根据不同任务需求进行数据提取和处理。

使用方法

使用MARVEL数据集时，用户需运行提供的Python脚本进行数据下载，并根据任务需求选择相应的.dat文件。例如，船舶分类任务可使用VesselClassification.dat文件，而船舶验证任务则需使用VesselVerificationTest.dat和VesselVerificationTrain.dat文件。下载完成后，图像数据将按特定文件结构存储，用户可根据元数据文件进行进一步的数据处理和模型训练。

背景与挑战

背景概述

MARVEL数据集由Erhan Gundogdu等研究人员于2016年创建，旨在为海事船舶的图像分类、验证、检索和识别任务提供大规模的图像数据支持。该数据集在亚洲计算机视觉会议（ACCV）上首次发布，标志着海事领域计算机视觉研究的一个重要里程碑。MARVEL数据集的核心研究问题是如何在大规模图像数据中有效区分和识别不同类型的海事船舶，这对于海事安全、船舶管理和自动化系统具有重要意义。通过提供详细的元数据和多样化的任务设置，MARVEL数据集为研究人员提供了一个全面的平台，推动了海事图像分析技术的进步。

当前挑战

MARVEL数据集在构建过程中面临了多个挑战。首先，海事船舶的多样性和复杂性使得图像分类任务变得尤为困难，尤其是不同类型船舶的外观相似性较高。其次，数据集的构建需要从多个来源获取图像，并确保图像质量和标注的准确性，这对数据采集和处理技术提出了高要求。此外，数据集的规模庞大，包含40万张图像，如何高效地下载、存储和管理这些数据也是一个技术难题。最后，数据集的多任务设置（如船舶验证、检索和识别）要求研究人员开发能够适应不同任务需求的算法，这对算法的鲁棒性和泛化能力提出了挑战。

常用场景

经典使用场景

MARVEL数据集在海洋船舶分类任务中展现了其经典应用。通过提供大规模的船舶图像及其详细的元数据，该数据集支持了船舶分类、验证、检索和识别等多种任务。特别是在船舶分类任务中，数据集通过VesselClassification.dat文件提供了船舶ID、集合索引、类别标签及其名称，为研究人员提供了丰富的训练和测试数据，从而推动了船舶分类算法的优化与验证。

解决学术问题

MARVEL数据集解决了海洋船舶图像识别领域的多个关键学术问题。首先，它为船舶分类提供了大规模的标注数据，使得研究人员能够开发和验证更精确的分类模型。其次，数据集支持船舶验证、检索和识别任务，这些任务在实际应用中具有重要意义，如船舶身份验证和海上交通监控。通过提供详细的IMO编号和船舶类型信息，MARVEL数据集为这些任务提供了坚实的基础，推动了相关领域的研究进展。

衍生相关工作

MARVEL数据集的发布激发了大量相关研究工作。许多研究者基于该数据集开发了新的船舶分类算法，提升了分类的准确性和鲁棒性。此外，数据集还推动了船舶验证和检索技术的研究，特别是在处理大规模船舶图像数据时，如何高效地进行相似性搜索和匹配成为研究热点。在船舶识别方面，基于MARVEL数据集的研究工作也取得了显著进展，特别是在处理复杂背景和多样化的船舶类型时，如何提高识别精度成为研究的重点。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集