MD-syn

github2024-12-26 更新2024-12-27 收录

下载链接：

https://github.com/LSXI7/MINIMA

下载链接

链接失效反馈

官方服务：

资源简介：

MD-syn是一个新的综合数据集，用于一般多模态图像匹配。它通过MINIMA数据引擎从MegaDepth数据集生成，包含额外的6种模态：红外、深度、事件、法线、素描和绘画。

MD-syn is a novel comprehensive dataset tailored for general multimodal image matching. It is generated from the MegaDepth dataset using the MINIMA data engine, and incorporates six additional modalities: infrared, depth, event, normal, sketch, and painting.

创建时间：

2024-12-17

原始信息汇总

MINIMA: Modality Invariant Image Matching

数据集概述

MINIMA 是一个用于多模态图像匹配的统一框架，旨在解决跨视角和跨模态图像匹配中的挑战。该框架通过数据扩展提升通用性能，并提出了一个简单但有效的数据引擎，能够生成包含多种模态、丰富场景和精确匹配标签的大规模数据集。

数据集详情

数据集名称: MegaDepth-Syn Dataset
生成方式: 从 MegaDepth 数据集使用 MINIMA 数据引擎生成，包含额外的 6 种模态：红外、深度、事件、法线、素描和绘画。
数据集发布: 数据集发布于 OpenXLab。

数据集下载

可以通过以下命令下载数据集： bash pip install openxlab --no-dependencies openxlab login openxlab dataset info --dataset-repo lsxi7/MINIMA openxlab dataset get --dataset-repo lsxi7/MINIMA openxlab dataset download --dataset-repo lsxi7/MINIMA --source-path /README.md --target-path /path/to/local/folder

模型权重下载

权重文件: minima_lightglue, minima_loftr, minima_roma
下载链接: Google Drive 或 GitHub

测试数据集

MegaDepth-1500-Syn: 从 megadepth-1500 下载并组织。
RGB-Infrared Test Dataset: 来自 XoFTR，可从 Google Drive 下载。
MMIM Test Dataset: 来自 Multi-modality-image-matching-database-metrics-methods。
RGB-Depth Test Dataset: 来自 DIODE，可从 Amazon Web Service 或 Baidu Cloud Storage 下载。
RGB-Event Test Dataset: 来自 DSEC，可从 Google Drive 下载。

数据集结构

推荐的数据集文件夹结构如下：

data/ ├── METU-VisTIR/ │ ├── index/ │ └── ... ├── Multi-modality-image-matching-database-metrics-methods/ │ ├── Multimodal_Image_Matching_Datasets/ │ └── ... ├── megadepth │ └── train/[modality]/Undistorted_SfM/ └── DIODE │ └── val/ └── DSEC ├── vent_list.txt ├── thun_01_a/ └── ...

引用

如果使用该数据集，请引用以下文献： bibtex @article{Jiang2024minima, title={MINIMA: Modality Invariant Image Matching}, author={Jiang, Xingyu and Ren, Jiangwei and Li, Zizhuo and Zhou, Xin and Liang, Dingkang and Bai, Xiang}, journal={arXiv preprint}, year={2024}, }

搜集汇总

数据集介绍

构建方式

MD-syn数据集的构建基于MINIMA框架，通过数据引擎从MegaDepth数据集中生成多模态图像数据。该数据引擎利用生成模型，将RGB图像数据扩展为包含红外、深度、事件、法线、素描和绘画等多种模态的数据集。通过这种方式，MD-syn不仅继承了RGB数据集的丰富场景和精确匹配标签，还填补了多模态图像匹配领域的数据空白。

特点

MD-syn数据集的特点在于其多样性和广泛性，涵盖了六种不同的图像模态，包括红外、深度、事件、法线、素描和绘画。该数据集不仅提供了丰富的场景和精确的匹配标签，还支持跨模态图像匹配任务。通过MD-syn，研究人员可以直接在随机选择的模态对上训练先进的匹配模型，从而获得跨模态能力。

使用方法

MD-syn数据集的使用方法包括下载和安装数据集，以及通过命令行工具进行数据准备和模型评估。用户可以通过OpenXLab平台下载数据集，并使用提供的脚本进行数据组织。此外，数据集支持多种模态的匹配任务，用户可以通过命令行工具选择不同的模态和模型进行测试。MD-syn还提供了详细的文档和示例代码，帮助用户快速上手并进行多模态图像匹配的研究。

背景与挑战

背景概述

MD-syn数据集由华中科技大学和武汉大学的研究团队于2024年推出，旨在解决跨模态图像匹配中的关键问题。该数据集基于MINIMA框架构建，通过生成模型扩展了MegaDepth数据集，新增了红外、深度、事件、法线、素描和绘画等多种模态。MD-syn的推出填补了多模态图像匹配领域的数据空白，为训练和评估跨模态图像匹配算法提供了丰富的资源。该数据集的研究背景源于多模态感知中图像匹配的重要性，尤其是在不同成像系统或风格导致的模态差异下，传统方法在泛化能力上表现不佳。MD-syn通过数据扩展和模态多样性，显著提升了跨模态匹配的性能，推动了该领域的研究进展。

当前挑战

MD-syn数据集在构建和应用过程中面临多重挑战。首先，跨模态图像匹配本身存在模态差异问题，不同模态之间的特征提取和匹配难度较大，传统方法难以在多种模态上实现一致的高性能。其次，数据集的构建依赖于生成模型，如何确保生成数据的多样性和准确性，同时保持与原始RGB数据的匹配标签一致性，是一个技术难点。此外，MD-syn的规模较大，数据存储、处理和传输的效率问题也对实际应用提出了挑战。最后，如何在真实场景中验证和推广该数据集的性能，尤其是在零样本任务中的表现，仍需进一步研究和优化。

常用场景

经典使用场景

在跨视角和跨模态的图像匹配研究中，MD-syn数据集被广泛应用于训练和评估多模态图像匹配算法。通过生成模型从RGB数据中扩展出多种模态，如红外、深度、事件等，MD-syn为研究者提供了一个丰富且多样化的数据平台，使得算法能够在不同模态之间进行有效的匹配。

解决学术问题

MD-syn数据集解决了多模态图像匹配中的模态差异问题。由于不同成像系统或风格导致的模态差异，传统的图像匹配方法往往难以泛化。MD-syn通过生成大量多模态数据，填补了通用多模态图像匹配的数据空白，使得研究者能够直接训练先进的匹配管道，从而在跨模态任务中取得显著提升。

衍生相关工作

MD-syn数据集衍生了一系列经典的多模态图像匹配研究工作。例如，基于MD-syn的MINIMA框架在跨模态匹配任务中表现出色，甚至超越了专门为特定模态设计的方法。此外，MD-syn还推动了生成模型在多模态数据扩展中的应用，为后续研究提供了宝贵的数据资源和算法基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集