five

farrell236/NSCLC-Radiomics-NIFTI

收藏
Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/farrell236/NSCLC-Radiomics-NIFTI
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-3.0 tags: - medical viewer: false --- # The Cancer Genome Atlas Ovarian Cancer (NSCLC-Radiomics) The models featured in this repository uses images from the publicly available [NSCLC-Radiomics](https://wiki.cancerimagingarchive.net/display/Public/NSCLC-Radiomics) Dataset. Download the data from TCIA with **Descriptive Directory Name** download option. ## Converting Format Convert DICOM images and segmentation to NIFTI format using [pydicom](https://pydicom.github.io/) and [pydicom-seg](https://razorx89.github.io/pydicom-seg/guides/read.html). Run: ```shell user@machine:~/NSCLC-Radiomics-NIFTI$ python convert.py ``` ## Segmentations Images will have one of the following segmentation files: ``` ─ seg-Esophagus.nii.gz ─ seg-GTV-1.nii.gz ─ seg-Heart.nii.gz ─ seg-Lung-Left.nii.gz ─ seg-Lung-Right.nii.gz ─ seg-Spinal-Cord.nii.gz ``` ## Requirements ``` dicom2nifti==2.4.6 pandas==1.5.0 pydicom==2.3.1 pydicom-seg==0.4.1 SimpleITK==2.2.0 tqdm==4.64.1 ``` ## Citation If using this repository, please cite the following works: ``` Data Citation Aerts, H. J. W. L., Wee, L., Rios Velazquez, E., Leijenaar, R. T. H., Parmar, C., Grossmann, P., Carvalho, S., Bussink, J., Monshouwer, R., Haibe-Kains, B., Rietveld, D., Hoebers, F., Rietbergen, M. M., Leemans, C. R., Dekker, A., Quackenbush, J., Gillies, R. J., Lambin, P. (2019). Data From NSCLC-Radiomics (version 4) [Data set]. The Cancer Imaging Archive. https://doi.org/10.7937/K9/TCIA.2015.PF0M9REI Publication Citation Aerts, H. J. W. L., Velazquez, E. R., Leijenaar, R. T. H., Parmar, C., Grossmann, P., Carvalho, S., Bussink, J., Monshouwer, R., Haibe-Kains, B., Rietveld, D., Hoebers, F., Rietbergen, M. M., Leemans, C. R., Dekker, A., Quackenbush, J., Gillies, R. J., Lambin, P. (2014, June 3). Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach. Nature Communications. Nature Publishing Group. https://doi.org/10.1038/ncomms5006 (link) TCIA Citation Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Volume 26, Number 6, December, 2013, pp 1045-1057. https://doi.org/10.1007/s10278-013-9622-7 ```

license: CC BY 3.0 tags: - 医学 viewer: false # 癌症基因组图谱卵巢癌(NSCLC-Radiomics) 本仓库所使用的模型均源自公开可用的[NSCLC-Radiomics](https://wiki.cancerimagingarchive.net/display/Public/NSCLC-Radiomics)数据集(NSCLC为非小细胞肺癌,Non-Small Cell Lung Cancer, NSCLC)。请从癌症影像档案(The Cancer Imaging Archive, TCIA)下载数据,并选择**描述性目录名**下载选项。 ## 格式转换 使用[pydicom](https://pydicom.github.io/)与[pydicom-seg](https://razorx89.github.io/pydicom-seg/guides/read.html)将医学数字成像和通信(Digital Imaging and Communications in Medicine, DICOM)影像及分割标注转换为神经影像信息学技术倡议格式(Neuroimaging Informatics Technology Initiative, NIFTI)。执行以下命令: shell user@machine:~/NSCLC-Radiomics-NIFTI$ python convert.py ## 分割标注 影像将对应以下任一分割文件: ─ seg-Esophagus.nii.gz ─ seg-GTV-1.nii.gz ─ seg-Heart.nii.gz ─ seg-Lung-Left.nii.gz ─ seg-Lung-Right.nii.gz ─ seg-Spinal-Cord.nii.gz ## 依赖环境 dicom2nifti==2.4.6 pandas==1.5.0 pydicom==2.3.1 pydicom-seg==0.4.1 SimpleITK==2.2.0 tqdm==4.64.1 ## 引用说明 若使用本仓库,请引用以下文献: ### 数据引用 Aerts, H. J. W. L.、Wee, L.、Rios Velazquez, E.、Leijenaar, R. T. H.、Parmar, C.、Grossmann, P.、Carvalho, S.、Bussink, J.、Monshouwer, R.、Haibe-Kains, B.、Rietveld, D.、Hoebers, F.、Rietbergen, M. M.、Leemans, C. R.、Dekker, A.、Quackenbush, J.、Gillies, R. J.、Lambin, P.(2019)。NSCLC-Radiomics(版本4)数据集[数据集]。癌症影像档案。https://doi.org/10.7937/K9/TCIA.2015.PF0M9REI ### 发表论文引用 Aerts, H. J. W. L.、Velazquez, E. R.、Leijenaar, R. T. H.、Parmar, C.、Grossmann, P.、Carvalho, S.、Bussink, J.、Monshouwer, R.、Haibe-Kains, B.、Rietveld, D.、Hoebers, F.、Rietbergen, M. M.、Leemans, C. R.、Dekker, A.、Quackenbush, J.、Gillies, R. J.、Lambin, P.(2014年6月3日)。通过定量放射组学方法利用无创成像解码肿瘤表型。《自然·通讯》。自然出版集团。https://doi.org/10.1038/ncomms5006(链接) ### TCIA引用 Clark K、Vendt B、Smith K、Freymann J、Kirby J、Koppel P、Moore S、Phillips S、Maffitt D、Pringle M、Tarbox L、Prior F.。《癌症影像档案(TCIA):维护与运营公共信息资源》,《数字成像杂志》,第26卷第6期,2013年12月,第1045-1057页。https://doi.org/10.1007/s10278-013-9622-7
提供机构:
farrell236
原始信息汇总

数据集概述

数据集名称

The Cancer Genome Atlas Ovarian Cancer (NSCLC-Radiomics)

数据来源

数据集使用的是公开可用的NSCLC-Radiomics数据集中的图像。

数据下载

数据应通过TCIA下载,并选择Descriptive Directory Name下载选项。

数据格式转换

数据集中的DICOM图像和分割数据需转换为NIFTI格式,使用pydicompydicom-seg工具进行转换。

分割文件

数据集包含以下分割文件:

  • seg-Esophagus.nii.gz
  • seg-GTV-1.nii.gz
  • seg-Heart.nii.gz
  • seg-Lung-Left.nii.gz
  • seg-Lung-Right.nii.gz
  • seg-Spinal-Cord.nii.gz

技术要求

  • dicom2nifti==2.4.6
  • pandas==1.5.0
  • pydicom==2.3.1
  • pydicom-seg==0.4.1
  • SimpleITK==2.2.0
  • tqdm==4.64.1

引用信息

数据引用

Aerts, H. J. W. L., Wee, L., Rios Velazquez, E., Leijenaar, R. T. H., Parmar, C., Grossmann, P., Carvalho, S., Bussink, J., Monshouwer, R., Haibe-Kains, B., Rietveld, D., Hoebers, F., Rietbergen, M. M., Leemans, C. R., Dekker, A., Quackenbush, J., Gillies, R. J., Lambin, P. (2019). Data From NSCLC-Radiomics (version 4) [Data set]. The Cancer Imaging Archive. https://doi.org/10.7937/K9/TCIA.2015.PF0M9REI

出版物引用

Aerts, H. J. W. L., Velazquez, E. R., Leijenaar, R. T. H., Parmar, C., Grossmann, P., Carvalho, S., Bussink, J., Monshouwer, R., Haibe-Kains, B., Rietveld, D., Hoebers, F., Rietbergen, M. M., Leemans, C. R., Dekker, A., Quackenbush, J., Gillies, R. J., Lambin, P. (2014, June 3). Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach. Nature Communications. Nature Publishing Group. https://doi.org/10.1038/ncomms5006

TCIA引用

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Volume 26, Number 6, December, 2013, pp 1045-1057. https://doi.org/10.1007/s10278-013-9622-7

搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,NSCLC-Radiomics-NIFTI数据集源自公开的NSCLC-Radiomics资源,其构建过程体现了严谨的数据处理流程。原始数据通过The Cancer Imaging Archive(TCIA)平台以经典目录结构获取,随后利用SimpleITK、pydicom及pydicom-seg等工具,将DICOM格式的医学影像与分割标注转换为标准化的NIFTI格式。这一转换不仅统一了数据表示,还通过脚本自动化处理,确保了数据的一致性与可重复性,为后续的影像分析奠定了坚实基础。
使用方法
使用该数据集时,研究者需从TCIA平台下载原始数据,并运行提供的Python转换脚本,将DICOM数据转化为NIFTI格式。对于分割标注,用户可根据需求选择独立使用各器官掩模,或通过配套脚本将其合并为单一文件以简化处理流程。数据加载后,可借助SimpleITK等库进行影像读取与预处理,进而应用于肿瘤分割、影像组学特征计算或机器学习模型训练等任务。为确保研究可追溯,使用时应遵循引用规范,注明原始数据及相关文献来源。
背景与挑战
背景概述
在医学影像与人工智能交叉领域,非小细胞肺癌(NSCLC)的精准诊疗一直是研究焦点。NSCLC-Radiomics数据集由Hugo J. W. L. Aerts等研究人员于2014年主导创建,依托癌症影像档案(TCIA)平台公开发布。该数据集旨在通过高通量提取影像组学特征,解码肿瘤表型,推动定量影像分析在肺癌预后预测与个性化治疗中的应用。其核心研究问题聚焦于如何利用非侵入性影像数据揭示肿瘤异质性,为临床决策提供客观依据,对肿瘤影像组学领域的发展产生了深远影响。
当前挑战
该数据集致力于解决非小细胞肺癌影像组学分析中的关键挑战,即如何从多模态医学影像中稳定提取并验证具有生物学意义的定量特征,以克服传统影像诊断的主观性与局限性。在构建过程中,研究者面临诸多技术难题,包括原始DICOM数据的标准化预处理、多器官分割标签的精确标注,以及不同影像设备与协议带来的异质性干扰。此外,将复杂的分割结果整合为统一的NIFTI格式,并确保数据的一致性与可重复性,亦是数据集构建中的核心挑战。
常用场景
经典使用场景
在医学影像分析领域,NSCLC-Radiomics-NIFTI数据集为研究者提供了非小细胞肺癌的标准化影像数据。该数据集通过将原始DICOM格式转换为NIFTI格式,并整合多器官分割标签,为放射组学研究奠定了数据基础。经典使用场景集中于构建端到端的放射组学流水线,从CT影像中提取定量特征,进而训练机器学习模型以识别肿瘤表型异质性。这种流程常被用于探索影像特征与临床结局之间的潜在关联,为精准医疗提供数据驱动的见解。
解决学术问题
该数据集有效解决了放射组学研究中数据标准化与可重复性的关键问题。通过提供统一格式的影像与分割数据,它使研究者能够规避DICOM数据处理的复杂性,专注于特征提取与模型开发。在学术层面,它支持了肿瘤表型无创解码的核心研究,助力于验证影像生物标志物的可靠性,并推动了定量影像分析方法的跨机构验证。其意义在于建立了公共数据基准,促进了放射组学从概念验证向临床转化研究的过渡。
实际应用
在实际临床转化中,NSCLC-Radiomics-NIFTI数据集为开发计算机辅助诊断系统提供了训练与验证资源。基于该数据构建的模型可应用于肺癌筛查、疗效预测及预后评估场景,辅助临床医生制定个性化治疗策略。例如,通过分析肿瘤与周围器官的影像特征,模型能够预测放疗反应或复发风险,从而优化治疗计划。这类应用不仅提升了诊疗效率,也为整合多模态数据以实现更全面的患者管理铺平了道路。
数据集最近研究
最新研究方向
在医学影像分析领域,非小细胞肺癌(NSCLC)的影像组学研究正日益成为精准医疗的前沿热点。基于NSCLC-Radiomics数据集,当前研究聚焦于利用深度学习模型从CT影像中提取高通量定量特征,以预测肿瘤表型、治疗反应及患者预后。随着人工智能在肿瘤学中的深度融合,该数据集推动了多模态数据融合、可解释性AI及自动化分割技术的发展,为个体化治疗决策提供了数据支撑,显著提升了肺癌诊疗的客观性与效率,对推动影像组学向临床转化具有里程碑意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作