five

MD-syn

收藏
github2024-12-26 更新2024-12-27 收录
下载链接:
https://github.com/LSXI7/MINIMA
下载链接
链接失效反馈
官方服务:
资源简介:
MD-syn是一个新的综合数据集,用于一般多模态图像匹配。它通过MINIMA数据引擎从MegaDepth数据集生成,包含额外的6种模态:红外、深度、事件、法线、素描和绘画。

MD-syn is a novel comprehensive dataset tailored for general multimodal image matching. It is generated from the MegaDepth dataset using the MINIMA data engine, and incorporates six additional modalities: infrared, depth, event, normal, sketch, and painting.
创建时间:
2024-12-17
原始信息汇总

MINIMA: Modality Invariant Image Matching

数据集概述

MINIMA 是一个用于多模态图像匹配的统一框架,旨在解决跨视角和跨模态图像匹配中的挑战。该框架通过数据扩展提升通用性能,并提出了一个简单但有效的数据引擎,能够生成包含多种模态、丰富场景和精确匹配标签的大规模数据集。

数据集详情

  • 数据集名称: MegaDepth-Syn Dataset
  • 生成方式: 从 MegaDepth 数据集 使用 MINIMA 数据引擎生成,包含额外的 6 种模态:红外、深度、事件、法线、素描和绘画。
  • 数据集发布: 数据集发布于 OpenXLab

数据集下载

可以通过以下命令下载数据集: bash pip install openxlab --no-dependencies openxlab login openxlab dataset info --dataset-repo lsxi7/MINIMA openxlab dataset get --dataset-repo lsxi7/MINIMA openxlab dataset download --dataset-repo lsxi7/MINIMA --source-path /README.md --target-path /path/to/local/folder

模型权重下载

  • 权重文件: minima_lightglue, minima_loftr, minima_roma
  • 下载链接: Google DriveGitHub

测试数据集

数据集结构

推荐的数据集文件夹结构如下:

data/ ├── METU-VisTIR/ │ ├── index/ │ └── ... ├── Multi-modality-image-matching-database-metrics-methods/ │ ├── Multimodal_Image_Matching_Datasets/ │ └── ... ├── megadepth │ └── train/[modality]/Undistorted_SfM/ └── DIODE │ └── val/ └── DSEC ├── vent_list.txt ├── thun_01_a/ └── ...

引用

如果使用该数据集,请引用以下文献: bibtex @article{Jiang2024minima, title={MINIMA: Modality Invariant Image Matching}, author={Jiang, Xingyu and Ren, Jiangwei and Li, Zizhuo and Zhou, Xin and Liang, Dingkang and Bai, Xiang}, journal={arXiv preprint}, year={2024}, }

搜集汇总
数据集介绍
main_image_url
构建方式
MD-syn数据集的构建基于MINIMA框架,通过数据引擎从MegaDepth数据集中生成多模态图像数据。该数据引擎利用生成模型,将RGB图像数据扩展为包含红外、深度、事件、法线、素描和绘画等多种模态的数据集。通过这种方式,MD-syn不仅继承了RGB数据集的丰富场景和精确匹配标签,还填补了多模态图像匹配领域的数据空白。
特点
MD-syn数据集的特点在于其多样性和广泛性,涵盖了六种不同的图像模态,包括红外、深度、事件、法线、素描和绘画。该数据集不仅提供了丰富的场景和精确的匹配标签,还支持跨模态图像匹配任务。通过MD-syn,研究人员可以直接在随机选择的模态对上训练先进的匹配模型,从而获得跨模态能力。
使用方法
MD-syn数据集的使用方法包括下载和安装数据集,以及通过命令行工具进行数据准备和模型评估。用户可以通过OpenXLab平台下载数据集,并使用提供的脚本进行数据组织。此外,数据集支持多种模态的匹配任务,用户可以通过命令行工具选择不同的模态和模型进行测试。MD-syn还提供了详细的文档和示例代码,帮助用户快速上手并进行多模态图像匹配的研究。
背景与挑战
背景概述
MD-syn数据集由华中科技大学和武汉大学的研究团队于2024年推出,旨在解决跨模态图像匹配中的关键问题。该数据集基于MINIMA框架构建,通过生成模型扩展了MegaDepth数据集,新增了红外、深度、事件、法线、素描和绘画等多种模态。MD-syn的推出填补了多模态图像匹配领域的数据空白,为训练和评估跨模态图像匹配算法提供了丰富的资源。该数据集的研究背景源于多模态感知中图像匹配的重要性,尤其是在不同成像系统或风格导致的模态差异下,传统方法在泛化能力上表现不佳。MD-syn通过数据扩展和模态多样性,显著提升了跨模态匹配的性能,推动了该领域的研究进展。
当前挑战
MD-syn数据集在构建和应用过程中面临多重挑战。首先,跨模态图像匹配本身存在模态差异问题,不同模态之间的特征提取和匹配难度较大,传统方法难以在多种模态上实现一致的高性能。其次,数据集的构建依赖于生成模型,如何确保生成数据的多样性和准确性,同时保持与原始RGB数据的匹配标签一致性,是一个技术难点。此外,MD-syn的规模较大,数据存储、处理和传输的效率问题也对实际应用提出了挑战。最后,如何在真实场景中验证和推广该数据集的性能,尤其是在零样本任务中的表现,仍需进一步研究和优化。
常用场景
经典使用场景
在跨视角和跨模态的图像匹配研究中,MD-syn数据集被广泛应用于训练和评估多模态图像匹配算法。通过生成模型从RGB数据中扩展出多种模态,如红外、深度、事件等,MD-syn为研究者提供了一个丰富且多样化的数据平台,使得算法能够在不同模态之间进行有效的匹配。
解决学术问题
MD-syn数据集解决了多模态图像匹配中的模态差异问题。由于不同成像系统或风格导致的模态差异,传统的图像匹配方法往往难以泛化。MD-syn通过生成大量多模态数据,填补了通用多模态图像匹配的数据空白,使得研究者能够直接训练先进的匹配管道,从而在跨模态任务中取得显著提升。
衍生相关工作
MD-syn数据集衍生了一系列经典的多模态图像匹配研究工作。例如,基于MD-syn的MINIMA框架在跨模态匹配任务中表现出色,甚至超越了专门为特定模态设计的方法。此外,MD-syn还推动了生成模型在多模态数据扩展中的应用,为后续研究提供了宝贵的数据资源和算法基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作