Dunhuang Grottoes Painting Dataset|敦煌壁画数据集|深度学习数据集

arXiv2019-07-11 更新2024-08-06 收录

敦煌壁画

深度学习

下载链接：

http://arxiv.org/abs/1907.04589v2

下载链接

链接失效反馈

资源简介：

该数据集专为敦煌石窟壁画修复而设计，提供了大量的训练和测试样本，足以支持深度学习方法的应用。

创建时间：

2019-07-10

AI搜集汇总

数据集介绍

构建方式

本数据集的构建旨在推动敦煌壁画保护与修复的数字化进程。敦煌莫高窟壁画作为珍贵的文化遗产，其壁画经历了千年岁月的侵蚀与老化。为模拟壁画的实际损坏情况，研究团队选取了莫高窟第7号洞窟的壁画，通过考古学家的努力，将大幅壁画分割为600幅独立图像，每幅图像聚焦于佛陀、建筑、装饰和人物等主题，分辨率介于500至800像素之间。数据集分为训练集和测试集，其中500幅图像用于训练，100幅用于测试，并提供了模拟壁画老化的方法。

使用方法

用户可以通过注册后从云端平台下载挑战数据集。下载的压缩包中包含了训练图像和测试图像，其中训练图像包括完好图像、老化区域掩膜以及老化图像。测试集仅提供老化图像。数据集的使用包括对图像进行修复，并将修复结果提交至服务器，服务器将自动使用DSSIM和LMSE等指标对结果进行评估。用户需确保提交的文件名符合规定格式，以便系统能够正确关联测试样本及其修复结果。

背景与挑战

背景概述

敦煌莫高窟壁画数据集（Dunhuang Grottoes Painting Dataset）承载着中国宝贵的文化遗产。该数据集的创建旨在推动莫高窟壁画的数字化保护与修复工作。莫高窟，位于甘肃省敦煌市东南部，是古代丝绸之路上的宗教文化交汇点，拥有492个洞窟，保存着超过45000平方米的壁画和2000余尊彩塑造像。这些壁画创作于公元4世纪至14世纪，对于历史、艺术和技术研究具有重大价值。然而，随着时间的推移，壁画遭受了严重的损害和老化。为应对这一挑战，敦煌研究院成立于1970年代，致力于系统地保护这些文化遗产。本研究推出了首个公开的敦煌莫高窟壁画数据集，为壁画修复研究提供了丰富的训练和测试样本，有力地推动了基于数据的壁画修复技术的发展。

当前挑战

敦煌莫高窟壁画数据集的构建面临诸多挑战。首先，数据集需解决的领域问题是壁画的高精度修复，这要求数据集能够真实地模拟壁画的损伤和老化过程。在构建过程中，挑战包括但不限于：1) 如何从物理损伤的壁画中提取高质量的图像数据；2) 如何生成能够模拟真实老化情况的损伤图像；3) 如何确保数据集的多样性和代表性，以涵盖莫高窟壁画中的各种内容和风格；4) 如何设计有效的评价指标来衡量修复结果的质量。这些挑战不仅涉及到数据采集和处理的技术问题，还包括如何利用这些数据推动计算机视觉和机器学习技术在壁画修复领域的应用。

常用场景

经典使用场景

敦煌莫高窟壁画数据集的问世，旨在推动文化遗产的数字化保护和修复工作。该数据集提供了一个丰富的壁画训练和测试样本集，特别适用于深度学习方法。其经典的使用场景在于，研究者可以利用这些数据来训练和测试计算机视觉模型，以实现对壁画的高精度自动修复。

解决学术问题

该数据集解决了传统手工修复壁画耗时巨大且效果受限的学术问题。通过提供壁画的清晰和破损样本，研究者和工程师可以开发出基于机器学习的自动修复算法，极大地提高了修复效率和质量，对于文化遗产保护具有重要意义。

实际应用

在实际应用中，敦煌莫高窟壁画数据集可以被广泛应用于文化遗产数字化保护、艺术品修复、历史研究以及艺术创作等多个领域。它不仅帮助实现了壁画的数字化保存，还促进了相关技术的进步和产业的发展。

数据集最近研究