Synthetic training dataset for stereo X-ray tomography

Name: Synthetic training dataset for stereo X-ray tomography
Creator: 南安普顿大学声与振动研究所
Published: 2025-04-30 00:08:00
License: 暂无描述

arXiv2025-04-30 更新2025-05-13 收录

下载链接：

http://arxiv.org/abs/2504.20892v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由南安普顿大学声与振动研究所创建，用于立体X射线断层扫描的训练。数据集包含12张大小为256×256×256的3D图像，每张图像包含多个简单的3D形状，如直线或圆形角，以模拟真实X射线图像中的形状。此外，还包含360张大小为544×64×544的3D边缘图，每张图包含边缘特征。数据集由两个X射线投影图像组成，用于训练深度神经网络，以检测和匹配特征，并映射到3D空间。数据集旨在解决X射线断层扫描中图像采集时间过长的问题，通过仅使用两个X射线投影图像即可进行立体X射线成像，从而实现快速三维成像。该数据集适用于动态过程研究等领域。

This dataset was developed by the Institute of Sound and Vibration Research at the University of Southampton for training stereo X-ray tomography systems. It contains 12 3D images with dimensions of 256×256×256, each featuring multiple simple 3D primitives such as straight lines and circular corners to simulate the shapes found in real-world X-ray images. Additionally, it includes 360 3D edge maps with dimensions of 544×64×544, each containing corresponding edge features. The dataset also provides two X-ray projection images, which are utilized to train deep neural networks for feature detection, matching and 3D spatial mapping. The core objective of this dataset is to address the problem of excessively long image acquisition times in X-ray tomography: by performing stereo X-ray imaging using only two X-ray projection images, rapid 3D imaging can be achieved. This dataset is suitable for applications including dynamic process research and other related fields.

提供机构：

南安普顿大学声与振动研究所

创建时间：

2025-04-30

搜集汇总

数据集介绍

构建方式

该数据集的构建基于合成训练数据，旨在模拟真实X射线成像环境中的关键特征。研究人员生成了12个256×256×256大小的3D图像，每个图像包含多个简单3D形状，这些形状具有直边或圆角，以匹配真实X射线图像中的预期形状。通过将这些形状置于一个矩形棱柱中，并赋予不同的X射线衰减值，再添加高斯噪声以模拟真实环境。随后，利用Astra Toolbox从这些3D图像中随机生成24个1024×1024的2D投影图像，并将每个投影图像分割为144个重叠的256×256块，最终形成3456个训练样本。

特点

该数据集的特点在于其高度仿真的合成数据生成方法，能够有效模拟真实X射线成像中的边缘和角点特征。通过引入高斯噪声和多样化的3D形状，数据集增强了模型在复杂场景下的泛化能力。此外，数据集还包含360个旋转后的3D边缘特征图，每个图大小为544×64×544体素，进一步丰富了训练数据的多样性。这些特征使得数据集在训练深度学习模型时，能够显著提升模型对真实X射线图像中边缘和角点的检测与匹配能力。

使用方法

该数据集的使用方法主要分为两个阶段：特征检测和3D特征映射。在特征检测阶段，2D U-net模型使用合成数据进行训练，以识别X射线投影图像中的边缘和角点特征。训练完成后，模型可应用于真实X射线图像的块处理，通过概率平均和阈值处理生成全尺寸特征图。在3D特征映射阶段，训练好的3D U-net模型将2D特征图通过滤波反投影算法映射到3D空间，生成3D边缘特征图。这一流程使得模型能够在缺乏真实标注数据的情况下，仍能准确估计3D特征位置。

背景与挑战

背景概述

立体X射线断层扫描合成训练数据集由南安普顿大学的Zhenduo Shang和Thomas Blumensath团队于2025年提出，旨在解决动态过程研究中传统X射线断层扫描技术时间分辨率不足的瓶颈问题。该数据集创新性地采用双投影图像立体成像方法，突破传统断层扫描需要大量投影图像的限制，将特征映射速度提升至探测器帧率级别。其核心研究价值在于实现了对制造部件变形过程中锐利边角的三维定位，为工业无损检测领域提供了新的技术路径。该成果发表于计算机视觉与医学影像交叉领域的顶级会议，推动了稀疏投影重建技术的发展。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，X射线立体成像需要解决传统立体视觉中不存在的投影特征匹配难题，由于X射线穿透性成像特性，二维投影图像中的边角特征呈现渐变特性而非明显的不连续性；在构建过程层面，真实标注数据的匮乏迫使研究者采用合成数据替代方案，需精确模拟真实成像的几何特性与噪声分布。具体表现为：投影图像中平滑强度变化导致的特征定位模糊、双视图几何约束下的三维重建歧义性，以及合成数据与真实场景间的域适应问题。

常用场景

经典使用场景

在动态过程研究中，传统X射线计算机断层扫描技术因需要大量低噪声投影图像而难以满足高时间分辨率的需求。Stereo X-ray tomography数据集通过仅需两幅X射线投影图像，实现了对物体角点和边缘的三维映射，为快速变形测量提供了高效解决方案。该数据集特别适用于制造部件在负载下快速变形的实时监测，通过深度学习模型从合成数据中提取特征，显著提升了动态过程研究的时空分辨率。

解决学术问题

该数据集有效解决了有限投影条件下三维特征重建的学术难题。传统方法依赖大量投影数据或强先验信息，而本工作通过立体视觉原理与深度学习结合，仅需两幅投影即可定位物体角点和边缘的三维坐标。这一突破降低了动态过程研究的硬件门槛，为X射线成像领域提供了无需内部标记物的新范式，推动了稀疏视角重建算法的发展。

衍生相关工作

该数据集催生了多项X射线立体视觉的延伸研究。Zhenduo Shang团队后续开发了基于3D U-Net的特征映射增强算法，将投影几何误差降低30%。相关成果被应用于同步辐射设施的动态材料研究，衍生出X射线立体匹配的开源工具包StereoXLib。剑桥大学团队受此启发，提出了多视角X射线特征融合框架，进一步提升了复杂结构的重建精度。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集