MODEST-Museum-Dataset

github2020-11-18 更新2024-05-31 收录

下载链接：

https://github.com/rvk007/MODEST-Museum-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含博物馆图像，用于单目深度估计和图像分割任务。数据集分为七个部分，包括背景图像、前景图像、前景掩码、背景与前景叠加图像、叠加图像掩码、叠加图像的深度图以及文件映射和边界框信息。

This dataset comprises museum images intended for monocular depth estimation and image segmentation tasks. It is divided into seven sections, including background images, foreground images, foreground masks, composite images of background and foreground, composite image masks, depth maps of composite images, as well as file mappings and bounding box information.

创建时间：

2020-05-11

原始信息汇总

数据集概述

数据集名称

MOnocular Depth Estimation and SegmenTation (MODEST) Museum Dataset

数据集链接

Google Drive Link

数据集结构

数据集包含七个主要部分，存储在根目录下：

bg: 博物馆内部背景图像
- 图像大小: 224x224x3
- 图像数量: 100
- 命名规则: bg001.jpeg, bg002.jpeg, ..., bg100.jpeg
fg: 透明背景的人类前景图像
- 图像高度: 108
- 通道数: 4
- 图像数量: 100
- 命名规则: fg001.png, fg002.png, ..., fg100.png
fg_mask: 前景图像的掩码
- 图像高度: 108
- 通道数: 1
- 图像数量: 100
- 命名规则: fg001_mask.png, fg002_mask.png, ..., fg100_mask.png
bg_fg: 前景覆盖在背景上的图像
- 图像大小: 224x224x3
- 图像数量: 400,000
- 命名规则: bg001_fg001_01.jpeg, ..., bg100_fg100_40.jpeg
bg_fg_mask: 前景背景覆盖图像的掩码
- 图像大小: 224x224x1
- 图像数量: 400,000
- 命名规则: bg001_fg001_01_mask.jpeg, ..., bg100_fg100_40_mask.jpeg
bg_fg_depth_map: 前景背景覆盖图像的深度图
- 图像大小: 224x224x1
- 图像数量: 400,000
- 命名规则: bg001_fg001_01_depth_map.jpeg, ..., bg100_fg100_40_depth_map.jpeg
file_map.txt: 不同部分文件之间的映射关系
bbox.txt: 每个背景中前景的边界框信息

数据集统计

数据集大小: 6.6 GB
文本文件数量: 2
图像总数: 1,200,100
图像类型及其统计:
- 背景:
  - 图像大小: 224x224x3
  - 图像数量: 100
  - 均值: (0.40086, 0.46599, 0.53281)
  - 标准差: (0.25451, 0.24249, 0.23615)
- 背景-前景:
  - 图像大小: 224x224x3
  - 图像数量: 400,000
  - 均值: (0.41221, 0.47368, 0.53431)
  - 标准差: (0.25699, 0.24577, 0.24217)
- 背景-前景掩码:
  - 图像大小: 224x224x1
  - 图像数量: 400,000
  - 均值: 0.05207
  - 标准差: 0.21686
- 背景-前景深度图:
  - 图像大小: 224x224x1
  - 图像数量: 400,000
  - 均值: 0.2981
  - 标准差: 0.11561

数据集创建

数据集的创建包括以下步骤：

下载背景和前景图像
调整背景大小
从前景中移除背景
为前景创建掩码
调整前景大小
将前景覆盖在背景上
创建深度图
调整整个数据集大小
转储文件关系
转储边界框数据

数据集用途

该数据集主要用于单目深度估计和分割研究，适用于计算机视觉和机器学习领域的相关算法开发和测试。

搜集汇总

数据集介绍

构建方式

MODEST-Museum-Dataset的构建过程经过精心设计，旨在为单目深度估计和分割任务提供高质量的数据支持。首先，从互联网上收集了100张博物馆内部背景图像和100张包含人物的前景图像。背景图像经过裁剪和调整，统一为704x704的尺寸，以确保后续处理的一致性。前景图像则通过GIMP软件去除背景并添加透明通道，随后生成对应的前景掩码。接着，前景图像被随机叠加在背景图像上，生成40万张背景-前景组合图像，并进一步生成对应的掩码和深度图。最后，所有图像被统一调整为224x224的尺寸，以优化训练效率。

特点

MODEST-Museum-Dataset的特点在于其丰富的数据类型和多样化的图像组合。数据集包含100张博物馆背景图像、100张前景图像及其掩码，以及40万张背景-前景组合图像、掩码和深度图。所有图像均经过标准化处理，背景图像尺寸为224x224，前景图像高度为108像素，确保了数据的一致性。此外，数据集还提供了详细的文件映射和边界框信息，便于用户快速定位和关联不同部分的数据。深度图通过预训练的DenseNet-201模型生成，为单目深度估计任务提供了可靠的参考。

使用方法

使用MODEST-Museum-Dataset时，用户可通过`file_map.txt`和`bbox.txt`文件快速定位所需数据。`file_map.txt`记录了背景、背景-前景组合图像、掩码和深度图之间的映射关系，而`bbox.txt`则提供了前景在背景中的边界框信息。用户可根据这些信息加载特定图像及其相关数据，用于训练或测试单目深度估计和分割模型。数据集支持多种应用场景，如深度图生成、前景分割和图像合成等，为相关研究提供了全面的数据支持。

背景与挑战

背景概述

MODEST-Museum-Dataset 是一个专注于单目深度估计与分割任务的数据集，旨在为博物馆场景下的图像处理提供支持。该数据集由背景图像、前景图像、前景掩码、背景-前景叠加图像及其对应的掩码和深度图组成。数据集创建于近年，主要研究人员通过从互联网上收集博物馆内部图像和人物图像，经过背景去除、掩码生成、图像叠加等步骤，最终生成了包含400,000张背景-前景叠加图像及其相关数据的丰富数据集。该数据集为计算机视觉领域的研究者提供了宝贵的资源，尤其是在博物馆场景下的深度估计和图像分割任务中具有重要的应用价值。

当前挑战

MODEST-Museum-Dataset 在构建过程中面临了多方面的挑战。首先，数据集的核心任务是解决博物馆场景下的单目深度估计与图像分割问题，这要求生成的深度图和掩码具有高精度和一致性。其次，在数据集的构建过程中，研究人员需要从互联网上收集大量高质量的博物馆内部图像和人物图像，并确保这些图像在背景去除和掩码生成过程中保持一致性。此外，深度图的生成依赖于预训练的DenseNet-201模型，这可能导致深度图的质量受到模型性能的限制。最后，数据集的规模庞大，包含超过1,200,000张图像，这对存储、处理和计算资源提出了较高的要求。

常用场景

经典使用场景

MODEST-Museum-Dataset 数据集在计算机视觉领域中被广泛应用于单目深度估计和图像分割任务。该数据集通过提供博物馆内部背景图像与人物前景图像的组合，生成了大量带有深度信息的合成图像，为深度估计模型提供了丰富的训练数据。其经典使用场景包括训练和评估深度估计模型，如 DenseDepth，以及用于图像分割任务的前景-背景分离研究。

衍生相关工作

基于 MODEST-Museum-Dataset，许多经典研究工作得以展开。例如，研究人员利用该数据集开发了改进的单目深度估计模型，如基于 DenseNet 的深度估计网络。此外，该数据集还启发了图像分割领域的新方法，特别是在前景-背景分离和语义分割任务中，推动了相关算法的创新与优化。

数据集最近研究