A cone-beam X-ray computed tomography data collection designed for machine learning
收藏github2024-12-14 更新2024-12-15 收录
下载链接:
https://github.com/hossein-momeni/DiffVox
下载链接
链接失效反馈官方服务:
资源简介:
这是一个为机器学习设计的锥束X射线计算机断层扫描数据集,包含48个核桃,每个核桃大约有3,600个高分辨率的X射线投影。
This is a cone-beam X-ray computed tomography (CT) dataset designed for machine learning. It includes 48 walnuts, with approximately 3,600 high-resolution X-ray projections for each walnut.
创建时间:
2024-12-02
原始信息汇总
DiffVox 数据集概述
数据集来源
- 数据集来源于研究 "A cone-beam X-ray computed tomography data collection designed for machine learning"。
- 该数据集包含48个核桃,每个核桃大约有3,600个高分辨率的X射线投影。
数据集规模
- 数据集的下载需要大约300 GB的存储空间。
- 下载时间可能需要大约10小时,具体取决于网络速度。
数据集使用
- 数据集可以通过运行
data.sh脚本来下载。 - 下载后,可以使用
slurm工具重建地面真实体积。
数据集重建
- 使用
diffvox框架可以对核桃进行重建。 - 重建脚本为
walnut_recon.py,可以通过指定核桃ID和视图数量来进行重建。
自定义数据集
- 用户可以通过创建
Dataset_DiffVox的子类来使用自己的数据集。 - 自定义数据集需要定义以下参数:
gt_projs:地面真实投影。sources:投影的源位置(世界坐标)。targets:投影的目标位置(世界坐标)。subject:表示数据集主题的torchio.Subject实例。
引用
-
如果使用DiffVox进行研究,请引用相关论文:
@article{momeni2024voxel, title={Voxel-based Differentiable X-ray Rendering Improves Self-Supervised 3D CBCT Reconstruction}, author={Momeni, Mohammadhossein and Gopalakrishnan, Vivek and Dey, Neel and Golland, Polina and Frisken, Sarah}, booktitle={Machine Learning and the Physical Sciences, NeurIPS 2024}, year={2024} }
搜集汇总
数据集介绍

构建方式
该数据集的构建基于锥束X射线计算机断层扫描(CBCT)技术,专门为机器学习应用设计。数据集包含48个核桃样本,每个样本具有约3600张高分辨率的X射线投影图像。这些投影图像通过物理基础的微分X射线渲染技术生成,确保了数据的真实性和准确性。数据集的构建过程包括从原始投影数据中重建真实的三维体积,这一过程通过使用`slurm`调度系统运行`construct_ground_truth.py`脚本实现,每个核桃样本的重建时间约为4分钟。
特点
该数据集的主要特点在于其高分辨率和物理基础的微分X射线渲染技术,这使得数据集在机器学习应用中具有极高的实用价值。每个核桃样本的3600张投影图像提供了丰富的细节信息,能够支持复杂的三维重建任务。此外,数据集的构建过程中使用了自监督框架DiffVox,该框架通过直接优化体素网格表示,显著提高了重建的精度和效率。
使用方法
使用该数据集时,用户可以通过运行`data.sh`脚本下载数据,并使用`walnut_recon.py`脚本进行核桃样本的重建。重建过程中,用户可以根据需要调整参数,如核桃样本的ID、使用的X射线视图数量、下采样因子等。此外,用户还可以通过定义自己的数据集类,将自定义数据集与DiffVox框架结合使用,确保数据集的兼容性和灵活性。
背景与挑战
背景概述
锥束X射线计算机断层扫描(CBCT)技术在医学成像领域具有重要应用,尤其是在三维重建方面。近年来,随着机器学习技术的快速发展,研究人员致力于开发能够直接优化体素网格表示的自监督框架,以提升CBCT重建的精度和效率。DiffVox数据集正是基于这一背景,由Mohammadhossein Momeni等人于2024年提出,旨在通过物理基础的可微分X射线渲染技术,实现高质量的CBCT重建。该数据集包含了48个核桃的高分辨率X射线投影,每个核桃约有3,600个投影,总数据量高达300GB。这一数据集的发布不仅为机器学习算法在CBCT重建中的应用提供了丰富的实验材料,还为相关领域的研究者提供了新的研究方向。
当前挑战
DiffVox数据集在构建和应用过程中面临多项挑战。首先,数据集的规模庞大,下载和存储需要大量的时间和资源,这对计算设备的存储能力和网络带宽提出了较高要求。其次,CBCT重建过程中,如何有效利用有限的X射线投影数据进行高质量的三维重建是一个关键问题。此外,物理基础的可微分渲染技术虽然能够提升重建精度,但其计算复杂度较高,如何在保证重建质量的同时提高计算效率,是研究人员需要解决的另一大挑战。最后,数据集的多样性和代表性也是需要考虑的问题,如何在有限的样本中确保重建算法的泛化能力,是未来研究的重点。
常用场景
经典使用场景
该数据集的经典使用场景主要集中在锥束X射线计算机断层扫描(CBCT)重建领域。通过提供48个核桃的高分辨率X射线投影数据,研究者可以利用这些数据进行自监督学习,优化体素网格表示,从而实现高质量的3D重建。典型的应用包括使用DiffVox框架进行物理基础的微分X射线渲染,以生成数字重建放射图像(DRR),并进一步优化重建结果。
衍生相关工作
基于该数据集,已衍生出多项经典工作,特别是在自监督学习和微分渲染领域。例如,DiffVox框架通过直接优化体素网格表示,实现了高质量的CBCT重建,展示了物理基础微分渲染在医学影像处理中的潜力。此外,该数据集还促进了基于深度学习的CBCT重建算法的研究,推动了自监督学习在医学影像处理中的应用,为未来的研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在医学影像领域,锥束X射线计算机断层扫描(CBCT)数据集的最新研究方向主要集中在自监督学习和物理基础的微分X射线渲染技术上。DiffVox框架通过直接优化体素网格表示,利用物理基础的微分X射线渲染进行CBCT重建,这一方法在提高重建精度的同时,显著减少了计算复杂度。该研究不仅推动了机器学习在医学影像处理中的应用,还为未来的自监督学习算法提供了新的思路,特别是在处理高分辨率和大容量数据集时,展现了其独特的优势和潜力。
以上内容由遇见数据集搜集并总结生成



