Vesuvius 3D Datasets

github2024-05-05 更新2024-05-31 收录

下载链接：

https://github.com/JamesDarby345/Vesuvius_3D_datasets

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在生成高质量、完整的3D体素实例标记数据，类似于Tim Skinner为Vesuvius Scroll Challenge March Open Source Prize制作的用于训练机器学习实例分割的数据。

This dataset is designed to generate high-quality, complete 3D voxel instance labeling data, similar to the data created by Tim Skinner for the Vesuvius Scroll Challenge March Open Source Prize, which is used for training machine learning instance segmentation.

创建时间：

2024-05-01

原始信息汇总

数据集概述

数据集目的

生产高质量、完整的3D体素实例标记数据，类似于Tim Skinner为Vesuvius Scroll Challenge March Open Source Prize所生产的数据。

数据集内容

包含10个初步的256^3 nrrd 3D实例标签，可通过Google Drive链接获取：drive link。

数据处理方法

初始分割：使用简单阈值区分滚动和非滚动区域，并应用后处理清理语义（滚动与否）掩码。
超体素生成：使用skimage的SLIC超像素函数，生成仅包含滚动表的超体素。
实例分离：利用.obj标签将超体素分离成表实例。
实例掩码应用：使用实例基础的obj交叉掩码将超体素大致分配到交叉点。
后处理与保存：进行后处理以分配未与.obj标签交叉的超体素，并将结果保存为nrrd文件。

数据集应用

旨在通过监督机器学习方法直接从体素中识别表，特别是在密集区域。
可能直接用于滚动分割，但目前不够稳健。

数据集局限性

依赖于.obj标签，限制了方法在标签密集指定的区域的应用。
在表接近时，.obj标签的交叉计算可能导致标签过宽，引起问题。
目前方法在创建实例分割方面不够稳健。

数据集发展方向

进一步开发此方法以增加其适用区域。
随着监督机器学习模型的训练，成功实例标签可被验证并用于更多训练数据，最终可能使此方法过时。

搜集汇总

数据集介绍

构建方式

Vesuvius 3D Datasets的构建方式主要基于对3D体素数据的处理与实例标注。首先，通过简单的阈值处理区分卷轴与非卷轴区域，并进行后处理以优化语义掩码。随后，利用skimage的SLIC超像素函数生成仅包含卷轴页面的超体素，这一步骤借鉴了Spelufo的SNIC超像素算法。接着，通过.obj标签计算体素坐标，将超体素分配到相应的卷轴实例中。最后，进行后处理并保存为nrrd文件，文件名包含体素坐标、块大小、分辨率等信息。

特点

该数据集的主要特点在于其3D体素实例标注的精细度与复杂性。数据集不仅提供了卷轴与非卷轴的语义分割，还通过.obj标签实现了卷轴页面的实例分割，这在处理密集卷轴区域时尤为重要。此外，数据集的构建过程允许通过监督学习模型不断优化和验证实例标签，从而提升数据集的质量和适用性。

使用方法

使用Vesuvius 3D Datasets时，用户可以通过提供的nrrd文件直接加载3D体素数据，并利用其中的实例标签进行卷轴页面的分割与识别。数据集适用于监督学习模型的训练，尤其是在处理密集卷轴区域时，能够提供宝贵的训练数据。用户还可以根据需要调整参数，进一步优化分割效果，并通过验证成功的实例标签生成更多的训练数据。

背景与挑战

背景概述

Vesuvius 3D Datasets是由James Darby创建的一个专注于三维体素实例标注的数据集，旨在为Vesuvius Scroll Challenge提供高质量的3D标注数据。该数据集的创建源于对古代卷轴自动分割技术的研究需求，特别是针对密集卷轴区域的分割挑战。通过生成256^3的nrrd格式3D实例标签，该数据集为机器学习模型提供了宝贵的训练资源，尤其是在处理复杂卷轴结构时，能够帮助模型更好地识别和分割卷轴的各个部分。

当前挑战

Vesuvius 3D Datasets面临的主要挑战包括：首先，如何在密集卷轴区域中有效提取卷轴表面的点，并将其分组为卷轴的各个部分，这是一个技术难点。其次，当前的自动分割方法依赖于3D Sobel核，但在密集区域中，这种方法的激活信号较弱，难以准确分割。此外，数据集的构建过程中，依赖于稀疏区域的.obj标签，这在处理复杂密集区域时存在局限性。最后，如何通过监督学习方法直接从体素中识别卷轴的各个部分，仍然是一个亟待解决的问题。

常用场景

经典使用场景

Vesuvius 3D Datasets 主要用于生成高质量、完整的3D体素实例标注数据，特别适用于古卷轴的自动分割任务。该数据集通过提供详细的3D体素标注，帮助研究人员在密集和稀疏的卷轴区域中进行精确的实例分割。其经典使用场景包括利用3D Sobel核提取卷轴表面点，并通过Mask3D算法将这些点分组为卷轴层，从而实现对古卷轴的自动分割和识别。

实际应用

在实际应用中，Vesuvius 3D Datasets 可广泛应用于文化遗产保护和数字化领域。例如，在考古学中，研究人员可以利用该数据集对古卷轴进行高精度的3D重建和自动分割，从而加速古文献的解读和保存。此外，该数据集还可用于开发更高效的卷轴分割算法，推动文化遗产数字化技术的进步，为全球文化遗产的保护和研究提供技术支持。

衍生相关工作

基于Vesuvius 3D Datasets，许多相关研究工作得以展开。例如，研究人员可以利用该数据集训练深度学习模型，进一步提高卷轴自动分割的精度和鲁棒性。此外，该数据集还激发了对图割算法、分水岭分割等其他分组算法的探索，以生成更多有价值的训练数据。这些衍生工作不仅丰富了古卷轴自动分割的研究内容，还为相关领域的技术发展提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集