A cone-beam X-ray computed tomography data collection designed for machine learning

github2024-12-14 更新2024-12-15 收录

下载链接：

https://github.com/hossein-momeni/DiffVox

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个为机器学习设计的锥束X射线计算机断层扫描数据集，包含48个核桃，每个核桃大约有3,600个高分辨率的X射线投影。

This is a cone-beam X-ray computed tomography (CT) dataset designed for machine learning. It includes 48 walnuts, with approximately 3,600 high-resolution X-ray projections for each walnut.

创建时间：

2024-12-02

原始信息汇总

DiffVox 数据集概述

数据集来源

数据集来源于研究 "A cone-beam X-ray computed tomography data collection designed for machine learning"。
该数据集包含48个核桃，每个核桃大约有3,600个高分辨率的X射线投影。

数据集规模

数据集的下载需要大约300 GB的存储空间。
下载时间可能需要大约10小时，具体取决于网络速度。

数据集使用

数据集可以通过运行data.sh脚本来下载。
下载后，可以使用slurm工具重建地面真实体积。

数据集重建

使用diffvox框架可以对核桃进行重建。
重建脚本为walnut_recon.py，可以通过指定核桃ID和视图数量来进行重建。

自定义数据集

用户可以通过创建Dataset_DiffVox的子类来使用自己的数据集。
自定义数据集需要定义以下参数：
1. gt_projs：地面真实投影。
2. sources：投影的源位置（世界坐标）。
3. targets：投影的目标位置（世界坐标）。
4. subject：表示数据集主题的torchio.Subject实例。

引用

如果使用DiffVox进行研究，请引用相关论文：

@article{momeni2024voxel, title={Voxel-based Differentiable X-ray Rendering Improves Self-Supervised 3D CBCT Reconstruction}, author={Momeni, Mohammadhossein and Gopalakrishnan, Vivek and Dey, Neel and Golland, Polina and Frisken, Sarah}, booktitle={Machine Learning and the Physical Sciences, NeurIPS 2024}, year={2024} }

搜集汇总

数据集介绍

构建方式

该数据集的构建基于锥束X射线计算机断层扫描（CBCT）技术，专门为机器学习应用设计。数据集包含48个核桃样本，每个样本具有约3600张高分辨率的X射线投影图像。这些投影图像通过物理基础的微分X射线渲染技术生成，确保了数据的真实性和准确性。数据集的构建过程包括从原始投影数据中重建真实的三维体积，这一过程通过使用`slurm`调度系统运行`construct_ground_truth.py`脚本实现，每个核桃样本的重建时间约为4分钟。

特点

该数据集的主要特点在于其高分辨率和物理基础的微分X射线渲染技术，这使得数据集在机器学习应用中具有极高的实用价值。每个核桃样本的3600张投影图像提供了丰富的细节信息，能够支持复杂的三维重建任务。此外，数据集的构建过程中使用了自监督框架DiffVox，该框架通过直接优化体素网格表示，显著提高了重建的精度和效率。

使用方法

使用该数据集时，用户可以通过运行`data.sh`脚本下载数据，并使用`walnut_recon.py`脚本进行核桃样本的重建。重建过程中，用户可以根据需要调整参数，如核桃样本的ID、使用的X射线视图数量、下采样因子等。此外，用户还可以通过定义自己的数据集类，将自定义数据集与DiffVox框架结合使用，确保数据集的兼容性和灵活性。

背景与挑战

背景概述

锥束X射线计算机断层扫描（CBCT）技术在医学成像领域具有重要应用，尤其是在三维重建方面。近年来，随着机器学习技术的快速发展，研究人员致力于开发能够直接优化体素网格表示的自监督框架，以提升CBCT重建的精度和效率。DiffVox数据集正是基于这一背景，由Mohammadhossein Momeni等人于2024年提出，旨在通过物理基础的可微分X射线渲染技术，实现高质量的CBCT重建。该数据集包含了48个核桃的高分辨率X射线投影，每个核桃约有3,600个投影，总数据量高达300GB。这一数据集的发布不仅为机器学习算法在CBCT重建中的应用提供了丰富的实验材料，还为相关领域的研究者提供了新的研究方向。

当前挑战

DiffVox数据集在构建和应用过程中面临多项挑战。首先，数据集的规模庞大，下载和存储需要大量的时间和资源，这对计算设备的存储能力和网络带宽提出了较高要求。其次，CBCT重建过程中，如何有效利用有限的X射线投影数据进行高质量的三维重建是一个关键问题。此外，物理基础的可微分渲染技术虽然能够提升重建精度，但其计算复杂度较高，如何在保证重建质量的同时提高计算效率，是研究人员需要解决的另一大挑战。最后，数据集的多样性和代表性也是需要考虑的问题，如何在有限的样本中确保重建算法的泛化能力，是未来研究的重点。

常用场景

经典使用场景

该数据集的经典使用场景主要集中在锥束X射线计算机断层扫描（CBCT）重建领域。通过提供48个核桃的高分辨率X射线投影数据，研究者可以利用这些数据进行自监督学习，优化体素网格表示，从而实现高质量的3D重建。典型的应用包括使用DiffVox框架进行物理基础的微分X射线渲染，以生成数字重建放射图像（DRR），并进一步优化重建结果。

衍生相关工作

基于该数据集，已衍生出多项经典工作，特别是在自监督学习和微分渲染领域。例如，DiffVox框架通过直接优化体素网格表示，实现了高质量的CBCT重建，展示了物理基础微分渲染在医学影像处理中的潜力。此外，该数据集还促进了基于深度学习的CBCT重建算法的研究，推动了自监督学习在医学影像处理中的应用，为未来的研究提供了新的思路和方法。

数据集最近研究