farrell236/DRR-RATE
收藏Hugging Face2024-06-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/farrell236/DRR-RATE
下载链接
链接失效反馈官方服务:
资源简介:
DRR-RATE数据集是基于CT-RATE数据集构建的,CT-RATE数据集包含25,692个非对比胸部CT扫描,来自21,304名独特患者。每个研究都附有相应的放射学文本报告和18个病理类别的二进制标签。DRR-RATE数据集通过修改从原始DICOM研究中提取的重建矩阵,扩展到了50,188个扫描。数据集已经匿名化,符合HIPAA规定,并且免除了知情同意的要求。CT-RATE数据集在CC BY-NC-SA许可下发布。
The DRR-RATE dataset is built upon the CT-RATE dataset, which comprises 25,692 non-contrast chest CT volumes from 21,304 unique patients. Each study is accompanied by a corresponding radiology text report and binary labels for 18 pathology classes. The dataset has been expanded to 50,188 volumes through the modification of the reconstruction matrix extracted from the raw DICOM study. The dataset is anonymized, compliant with HIPAA, and the requirement for informed consent was waived. CT-RATE is published under the CC BY-NC-SA license.
提供机构:
farrell236
原始信息汇总
数据集概述
数据集名称: DRR-RATE Dataset
数据集来源: 基于CT-RATE数据集扩展而来,原始数据集包含25,692个非对比胸部CT体积,来自21,304名独特患者。
数据集规模: 扩展至50,188个体积。
数据内容: 每个研究伴随相应的放射学文本报告和18种病理类别的二元标签。
数据处理: 使用多种重建技术从原始DICOM图像数据中扩展数据集。
隐私与合规性: 数据已匿名化,符合健康保险流通与责任法案(HIPAA),无需知情同意。
许可证: 遵循Creative Commons Attribution-NonCommercial-ShareAlike (CC-BY-NC-SA) 4.0许可证。
数据生成工具
工具名称: ./getDRRSiddonJacobsRayTracing
功能: 用于生成CT-RATE数据集的数字重建放射图像(DRR)。
参数调整: 默认参数外,调整了y轴上的体积偏移量为300 mm,设置阈值为-100 Hounsfield单位(HU),并通过绕z轴逆时针旋转90度创建侧视图图像。
使用示例: shell user@machine:~$ ./getDRRSiddonJacobsRayTracing input_volume.nii.gz -o output_drr.png -threshold -100 -t 0 300 0 -rz -90 # if LATERAL view
搜集汇总
数据集介绍

构建方式
DRR-RATE数据集是在CT-RATE数据集的基础上构建而成,CT-RATE数据集包含来自21304名独特患者的25692个非对比胸部CT体积影像。通过对原始DICOM研究的重建矩阵进行修改,数据集扩展至50188个体积影像。该数据集在确保符合HIPAA规定且已匿名化的基础上,无需知情同意即进行了发布。
特点
本数据集的核心特点在于采用了Siddon-Jacobs射线追踪算法生成数字重建射影片(DRR),以用于疾病的分类研究。数据集包含了18种病理类别的二进制标签,并伴有相应的放射学文本报告。所有体积影像均经过调整,以增强视野范围,并设置了-100 Hounsfield单位的阈值截止,以优化图像质量。
使用方法
使用DRR-RATE数据集时,用户需运行提供的二进制工具`getDRRSiddonJacobsRayTracing`,并根据需求调整参数,如设置阈值、调整体积位置及旋转角度等。生成的DRR图像可用于进一步的研究与分析,如疾病分类模型的训练与评估。
背景与挑战
背景概述
在医学影像分析领域,数字化重建射线图(Digitally Reconstructed Radiographs,简称DRR)作为一种重要的影像重建技术,对于疾病分类与诊断具有显著的应用价值。DRR-RATE数据集是在CT-RATE数据集基础上构建的扩展数据集,由Hou, Benjamin等研究人员于2024年开发完成。该数据集包含了50,188个通过修改原始DICOM研究的重建矩阵生成的胸部CT影像卷,旨在为监督级零样本异常检测提供基础模型。数据集遵循Creative Commons Attribution-NonCommercial-ShareAlike (CC BY-NC-SA)许可,确保了研究合规性与数据共享的合法性。
当前挑战
尽管DRR-RATE数据集提供了丰富的影像资料,但在构建过程中仍面临诸多挑战。首先,精确的射线追踪算法实现是关键,需要保证DRR图像的质量与准确性。其次,数据集构建中涉及到的大量计算需要高效的处理能力。此外,确保数据隐私和合规性也是一个重大挑战,尤其是在处理匿名化数据时,必须遵守HIPAA等相关法规。在研究领域问题方面,如何利用DRR图像进行高效的疾病分类与诊断,以及如何提升模型的泛化能力,是当前研究的主要挑战。
常用场景
经典使用场景
在医学影像分析领域,DRR-RATE数据集以其丰富的病理类别和精确的重建矩阵调整,成为研究数字化重建射线图(DRR)生成算法的重要资源。该数据集的经典使用场景主要集中于开发与优化DRR图像生成技术,以及基于DRR图像进行疾病分类和病变检测的研究。
解决学术问题
DRR-RATE数据集解决了传统DRR生成中存在的准确性不足和计算效率低下的问题,为医学影像诊断领域提供了一种高效且准确的病变检测方法。其对于探索零样本学习在医学图像分析中的应用具有重要的学术价值,有助于推动医学影像分析技术的发展。
衍生相关工作
基于DRR-RATE数据集的研究已经衍生出了一系列相关工作,包括但不限于病变检测算法的改进、医学影像的三维可视化技术,以及结合深度学习的影像诊断模型。这些工作进一步拓展了数据集的应用范围,对医学影像分析领域产生了深远的影响。
以上内容由遇见数据集搜集并总结生成



