five

基于病理信息的跨时空肺结节数据集

收藏
arXiv2024-06-26 更新2024-06-28 收录
下载链接:
https://zenodo.org/record/8354947; https://zenodo.org/record/8357533
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为‘基于病理信息的跨时空肺结节数据集’,由山东大学第二医院创建。该数据集包含328个CT序列和362个标注的结节,来源于109名患者。数据集的创建过程严格遵循病理信息指导,确保了结节定位和定量的准确性。此数据集主要用于推动计算机辅助检测(CAD)技术的发展,特别是在肺结节的精确筛查和诊断方面,为精准医疗领域的进一步探索提供了新的动态视角。

This dataset, named "Cross-Spatiotemporal Pulmonary Nodule Dataset Based on Pathological Information", was created by the Second Hospital of Shandong University. It contains 328 CT sequences and 362 annotated nodules, derived from 109 patients. The dataset construction process strictly adheres to guidance from pathological information, ensuring the accuracy of nodule localization and quantification. This dataset is primarily used to promote the development of computer-aided detection (CAD) technologies, particularly in the precise screening and diagnosis of pulmonary nodules, providing a new dynamic perspective for further exploration in the field of precision medicine.
提供机构:
山东大学第二医院
创建时间:
2024-06-26
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于病理信息,旨在整合肺结节在时空维度上的丰富多模态信息。研究人员从山东大学第二医院收集了109位患者的328个CT扫描序列,其中包括250个恶性结节和112个良性结节的切片。数据收集过程包括四个关键阶段:从电子病历系统中识别病例、从病理信息系统中记录病理诊断、从影像归档和通信系统中检索患者影像数据,以及在专家医师指导下进行结节标注。标注过程严格遵循病理信息,确保每个结节的位置和轮廓与病理诊断精确对应。此外,为了满足实际临床诊断和治疗的需求,数据集中还包含了1.25mm和5mm两种层厚的CT序列。
特点
该数据集具有以下特点:首先,它是一个跨时空的数据集,包含了患者在不同时间点的CT扫描序列,从而能够揭示肺结节随时间演变的规律;其次,数据集中包含了丰富的病理信息,有助于研究者进行更精确的结节分类和诊断;再次,数据集具有多样化,结节大小、病理类型和层厚等方面均有覆盖,能够满足不同研究需求;最后,数据集在构建过程中经过严格的质量控制,确保了数据的准确性和可靠性。
使用方法
数据集的使用方法如下:首先,用户可以从提供的链接中下载数据集,链接分别为https://zenodo.org/record/8354947和https://zenodo.org/record/8357533。下载后,用户可以根据需要选择使用1.25mm或5mm层厚的CT序列。数据集分为分类和检测两种类型,用户可以根据研究目的选择相应的数据集。对于分类数据集,数据以BMP格式提供,并已压缩为“class_dataset.zip”文件,其中包含训练集和测试集。对于检测数据集,数据以MHD和BMP格式提供,其中MHD格式的数据包含原始图像、肺分割图像和标注信息,BMP格式的数据则包含了经过数据增强的图像。用户可以使用提供的Python代码进行数据转换和数据操作,以便更好地理解和利用数据集。
背景与挑战
背景概述
随着计算机辅助检测(CAD)技术的进步,肺结节智能分析在提高肺癌诊断准确率方面发挥了重要作用。然而,现有的CAD系统和肺数据集主要关注单一时间点的CT图像,忽略了不同时期成像数据中结节进展相关的跨时空特征。为了探索结节在患者CT序列中不同时期的演变模式,一个包含病理信息的跨时空肺结节数据集被构建,该数据集包含来自109名患者的328个CT序列和362个注释结节。这个综合数据库旨在推动CAD领域向更实用、更稳健的方法发展,并为精准医学相关领域的进一步探索做出贡献。
当前挑战
该数据集的主要挑战包括:1) 解决的领域问题:现有的CAD系统和肺数据集主要关注单一时间点的CT图像,忽略了不同时期成像数据中结节进展相关的跨时空特征。2) 构建过程中所遇到的挑战:数据集的构建需要确保患者隐私,同时还要保证数据的准确性和完整性。此外,不同时期和来源的数据整合也是一个挑战。
常用场景
经典使用场景
该数据集主要应用于肺结节识别与诊断,旨在通过分析患者在不同时间段的CT扫描图像,揭示肺结节的跨时空特征及其演变规律,从而辅助医生进行精准的肺癌筛查与诊断。该数据集包含了来自109名患者的328个CT序列和362个已标注的结节,为研究者提供了丰富的数据资源,以推动计算机辅助检测(CAD)技术在肺结节识别与诊断方面的研究,并促进精准医学领域的探索。
实际应用
在实际应用中,该数据集可以用于训练和评估肺结节检测模型,以提高模型的准确性和鲁棒性。此外,该数据集还可以用于研究肺结节的演变规律,为肺癌的早期诊断和治疗提供科学依据。通过分析结节的跨时空特征,医生可以更准确地预测肺癌的发展趋势,为患者制定个性化的治疗方案。此外,该数据集还可以用于研究肺结节与其他肺部疾病的关系,为肺部疾病的诊断和治疗提供新的思路。
衍生相关工作
该数据集的构建推动了肺结节识别与诊断领域的研究,为后续研究提供了重要的数据基础。基于该数据集,研究者们可以进一步探索肺结节的演变规律,研究肺结节与其他肺部疾病的关系,以及开发更精确的肺结节检测模型。此外,该数据集还可以用于研究肺结节的影像特征,为肺癌的早期诊断和治疗提供科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作