andreped/AeroPath
收藏Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andreped/AeroPath
下载链接
链接失效反馈官方服务:
资源简介:
AeroPath数据集包含27个计算机断层扫描血管造影(CTA)扫描,这些扫描是在挪威特隆赫姆的圣奥拉夫医院使用胸部肺部协议获取的。数据集中的患者(九名女性)年龄在52至84岁之间(中位数70岁),均因肺癌诊断测试而接受检查,涵盖了包括恶性肿瘤、结节病和肺气肿在内的多种病理情况。数据集的生成和注释过程包括从区域生长方法到手动修正的多个步骤,所有注释均由肺科医生进行验证。
The AeroPath dataset consists of 27 computed tomography angiography (CTA) scans acquired at St. Olav's Hospital in Trondheim, Norway, using a chest and lung imaging protocol. The patients included in the dataset (nine females) range in age from 52 to 84 years, with a median age of 70 years, and all underwent examinations for lung cancer diagnostic workup. The cohort covers a diverse set of pathological conditions including malignant neoplasms, sarcoidosis, and emphysema. The dataset generation and annotation workflow includes multiple steps spanning from region-growing methods to manual corrections, with all annotations validated by pulmonologists.
提供机构:
andreped
原始信息汇总
数据集概述
基本信息
- 数据集名称: AeroPath
- 任务类别: 图像分割
- 语言: 英语
- 标签: 医学
- 数据集大小: 1B<n<10B
- 许可证: MIT
详细信息
- 标题: AeroPath
- 出版物和DOI: "AeroPath: An airway segmentation benchmark dataset with challenging pathology". https://arxiv.org/abs/2311.01138
- 联系信息:
- 姓名: Erlend F. Hofstad
- 机构: Medical Technology Department, SINTEF Digital, Trondheim
- 邮箱: erlend.hofstad@sintef.no
- 网站: https://www.sintef.no/en/all-employees/employee/erlend.hofstad/
- 贡献者: Karen-Helene Støverud, Haakon Olav Leira, Erlend F. Hofstad, Andre Pedersen, David Bouget, 和 Thomas Langø.
- 数据类型: 计算断层扫描血管造影(CTA)扫描和二进制注释掩码,所有文件存储为NifTI文件(*.nii.gz)。
- 数据收集日期: 未提供
- 地理位置: Trondheim, Norway
- 资金来源: 挪威卫生和护理服务部通过挪威国家研究机构进行微创和影像引导诊断和治疗的Minimally Invasive and Image-Guided Diagnostics and Therapy (MiDT) 在St. Olavs医院,Trondheim大学医院,Trondheim,挪威。此外,研究还获得了挪威金融机制2014-2021项目RO-NO2019-0138, 19/2020“使用人工智能和医疗机器人改进柔性内镜下的癌症诊断”IDEAR,合同号19/2020的资助。
数据集描述
- 概述和伦理批准: 数据集包含27个计算断层扫描血管造影(CTA)扫描,使用Thorax Lung协议在St. Olavs医院(Trondheim,挪威)获取。包含的患者(9名女性)年龄在52至84岁(中位数70岁),均在进行肺癌诊断测试,并患有广泛的病理,包括恶性肿瘤、肉瘤和肺气肿。
共享/访问信息
- 许可证/限制: CC-BY 4.0(见license.md)
- 推荐引用: 见https://github.com/raidionics/AeroPath的推荐引用。
数据和文件概述
- 文件列表:
- README.md
- license.md
- 1/
- 1_CT_HR.nii.gz
- 1_CT_HR_label_airways.nii.gz
- 1_CT_HR_label_lungs.nii.gz
- ...
- 27/
- 27_CT_HR.nii.gz
- 27_CT_HR_label_airways.nii.gz
- 27_CT_HR_label_lungs.nii.gz
方法论信息
- 数据收集/生成的方法描述:
- 数据集统计: CT扫描的尺寸覆盖[487 : 512] × [441 : 512] × [241 : 829]体素,横轴体素大小范围[0.68 : 0.76] × [0.68 : 0.75] mm²,重建切片厚度[0.5 : 1.25] mm。
- 注释过程: 生成地面真相的注释过程分为三个步骤。首先,基于区域生长或grow-cut方法提取最大的组件(即气管和第一个分支)。由于泄漏,区域生长方法在所有情况下都没有产生满意的结果。因此,在某些情况下,使用了3D Slicer中的grow-cut方法。在第二步中,使用BronchiNet分割较小的外周气道。在第三步和最后一步中,手动细化分割。在视觉检查的基础上连接支气管片段和遗漏的片段,然后移除假阳性和无法连接的片段。所有手动修正均使用3D Slicer中的默认分割编辑器进行。手动修正由受过训练的工程师执行,由肺科医生监督。最后,所有注释均由肺科医生逐案验证。AeroPath分割的最终注释平均每个CT扫描包含128 ± 56个分支。
搜集汇总
数据集介绍

构建方式
AeroPath数据集的构建基于27例计算机断层扫描血管造影(CTA)数据,这些数据采集自挪威特隆赫姆的圣奥拉夫医院,采用胸部肺部扫描协议。数据集包含来自9名女性患者的扫描数据,年龄范围为52至84岁,中位数为70岁,所有患者均因肺癌诊断接受检查,并伴有多种病理情况,如恶性肿瘤、结节病和肺气肿。数据标注过程分为三步:首先使用区域生长或grow-cut方法提取主要气道结构,随后通过BronchiNet算法分割较小的外周气道,最后通过3D Slicer软件进行手动修正和验证,确保标注的准确性。
特点
AeroPath数据集的特点在于其专注于气道分割任务,并包含具有挑战性的病理案例。数据集中的CTA扫描覆盖了[487 : 512] × [441 : 512] × [241 : 829]体素范围,横轴体素尺寸为[0.68 : 0.76] × [0.68 : 0.75] mm²,重建切片厚度为[0.5 : 1.25] mm。每例扫描的平均气道分支数为128 ± 56,标注过程由工程师在肺科医生的监督下完成,确保了数据的高质量和临床相关性。
使用方法
AeroPath数据集的使用建议通过Python API进行访问,具体操作可参考提供的Colab笔记本链接。数据集以NifTI文件格式存储,包含原始CTA扫描和二进制标注掩码。用户可通过加载这些文件进行气道分割模型的训练和评估。数据集的使用需遵循CC-BY 4.0许可协议,并建议引用相关文献以支持其学术应用。
背景与挑战
背景概述
AeroPath数据集由挪威SINTEF Digital医疗技术部门的Erlend F. Hofstad等人于2023年创建,旨在为气道分割领域提供一个具有挑战性的基准数据集。该数据集包含27例计算机断层扫描血管造影(CTA)图像,涵盖了多种肺部病理情况,如恶性肿瘤、结节病和肺气肿。这些数据由挪威卫生与护理服务部资助,并在St. Olavs医院采集,主要用于肺癌诊断研究。AeroPath的发布为医学图像分割领域提供了重要的数据支持,特别是在复杂病理条件下的气道分割任务中,具有显著的学术和临床应用价值。
当前挑战
AeroPath数据集在构建过程中面临多重挑战。首先,气道分割本身是一个复杂的任务,尤其是在存在病理变化的情况下,传统区域生长方法容易因泄漏问题导致分割失败,因此需要结合多种算法进行优化。其次,数据标注过程极为繁琐,涉及多步骤的自动分割与人工校正,且需由专业工程师和肺科医生共同完成,以确保标注的准确性。此外,数据集的规模相对较小,仅包含27例样本,可能限制了其在深度学习模型训练中的泛化能力。这些挑战不仅反映了气道分割任务的复杂性,也为未来研究提供了改进方向。
常用场景
经典使用场景
在医学影像分析领域,AeroPath数据集被广泛应用于气道分割任务。该数据集包含了27例计算机断层扫描血管造影(CTA)图像及其对应的二值标注掩码,特别适用于开发与验证气道分割算法。研究人员可以利用这些数据来训练深度学习模型,以提高在复杂病理条件下的气道分割精度。
实际应用
在实际应用中,AeroPath数据集为临床医生提供了重要的辅助工具,特别是在肺癌诊断和治疗规划中。通过利用该数据集训练的模型,医生可以更准确地识别和评估气道结构,从而提高诊断的准确性和治疗的有效性。此外,该数据集还可用于开发自动化诊断系统,以减轻医生的工作负担。
衍生相关工作
基于AeroPath数据集,研究人员已经开展了多项经典工作,特别是在深度学习与医学影像分析的交叉领域。例如,一些研究利用该数据集开发了基于卷积神经网络(CNN)的气道分割模型,显著提高了分割精度。此外,该数据集还被用于评估不同分割算法的性能,为相关研究提供了重要的参考依据。
以上内容由遇见数据集搜集并总结生成



