five

Lung Nodule Dataset with Histopathology-based Cancer Type Annotation

收藏
arXiv2024-06-26 更新2024-06-28 收录
下载链接:
https://doi.org/10.5281/zenodo.8422229, https://doi.org/10.5281/zenodo.11024613
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为‘基于组织病理学的肺癌类型标注肺结节数据集’,由临沂大学信息科学与技术学院的研究团队创建。数据集包含330个来自95名不同患者的肺部CT图像,每个结节都通过边界框进行标注。数据集的创建旨在通过提供精确的癌症类型标签,促进对不同类型肺疾病的精细分类,从而为医疗诊断提供更精确的治疗建议。数据集中的结节大小多样,特别是包含大量微小结节,为CAD系统的检测性能提供了挑战。此外,数据集还包含了基于患者临床诊断、冷冻诊断和病理诊断的癌症类型标签,这些标签经过专业医生的综合考虑,确保了标签的准确性。数据集的应用领域主要集中在提高肺结节分类和检测的准确性,以及辅助医疗诊断。

This dataset is named Lung Nodule Dataset with Lung Cancer Type Annotations Based on Histopathology, and was created by the research team from the School of Information Science and Technology, Linyi University. It contains 330 lung CT images from 95 unique patients, with each nodule annotated via bounding boxes. The dataset was developed to enable fine-grained classification of various pulmonary diseases by providing accurate cancer type labels, thereby supporting more precise treatment recommendations for medical diagnosis. The nodules in the dataset exhibit diverse sizes, including a large quantity of micronodules, which presents challenges for the detection performance of CAD systems. Additionally, the dataset includes cancer type labels derived from patients' clinical diagnoses, frozen section diagnoses, and pathological diagnoses. These labels have been thoroughly reviewed by professional physicians to guarantee their accuracy. The primary application areas of this dataset focus on enhancing the accuracy of lung nodule classification and detection, as well as assisting clinical medical diagnosis.
提供机构:
临沂大学信息科学与技术学院
创建时间:
2024-06-26
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集是通过与临沭中心医院的合作,收集了95名患者的胸部CT扫描图像,并对这些图像进行了标注。标注过程分为两个阶段:首先由两名医生对CT扫描图像进行标注,记录肺结节的位置信息,并生成包含临床、冷冻和病理诊断信息的医疗报告;其次,由两名标注员对图像进行标注,标注结节的位置坐标和直径,并将肺癌类型转换为整数字符标签。为了保护患者隐私,所有敏感信息都被匿名化处理。数据预处理包括将原始数据转换为Hounsfield Units (HU),限制HU值范围,调整图像大小,以及进行数据增强。
特点
该数据集具有三个主要特点:精确的癌症类型标注、具有挑战性的微小结节检测和丰富的癌症分类类别。数据集中包含308个样本,其中103个为良性样本,172个为腺癌样本,33个为鳞状细胞癌样本,这些样本具有不同的分类难度。此外,数据集中还包含了大量微小和小的结节,这对基于CT图像的肺结节检测提出了挑战。
使用方法
该数据集已公开发布在Zenodo平台,用户可以通过指定链接访问数据集。数据集被分为四个部分,每个部分包含不同的文件格式和任务要求。用户可以根据自己的需求选择相应的数据部分进行使用。同时,为了方便用户使用,我们还提供了一个GitHub仓库,其中包含了Python示例代码,用于数据类型转换和数据操作。
背景与挑战
背景概述
肺癌作为全球医疗专业人士面临的最具挑战性的疾病之一,其早期诊断对于降低死亡率至关重要。基于此,Jian等人于2024年创建了一个名为'Lung Nodule Dataset with Histopathology-based Cancer Type Annotation'的数据集。该数据集由来自95名患者的330个标注结节(以边界框形式标注)的胸部CT图像组成,旨在为医学诊断提供可靠的工具,以便更精细地对不同类型的肺部疾病进行分类,并提供更精确的治疗建议。该数据集的核心研究问题是提高肺结节分类和检测的准确性,以及对不同类型肺癌的预测能力。该数据集的创建为医学影像分析领域的发展提供了有力支持,并对临床诊断流程的辅助诊断产生了深远影响。
当前挑战
该数据集面临的挑战主要包括:1) 所解决的领域问题:尽管CAD系统能够在检测肺结节方面取得高性能,但在准确预测多种癌症类型方面面临挑战。2) 构建过程中所遇到的挑战:数据集包含大量小尺寸结节的CT图像样本,这对基于CT图像的肺结节检测提出了显著挑战。此外,数据集中包含不同类别的结节,这些结节在大小、异质性和CT切片中病变的纹理/外观上存在差异,使得不同医生可能给出不同的诊断和预测结果。为了解决这些问题,研究人员需要开发更先进的CAD系统,以更精确地识别和分类肺结节,并为不同类型的肺癌提供更准确的治疗建议。
常用场景
经典使用场景
该数据集在肺结节检测和癌症分类方面具有广泛的应用。它包含了95位患者的CT图像,共计330个已标注的结节。这些结节被标注为边界框,并通过临床诊断、冷冻诊断和病理诊断信息进行了精确的癌症类型标注。这使得数据集成为研究肺结节检测和癌症分类的理想工具。研究者可以利用这个数据集来训练和评估各种模型,以提高肺结节检测和癌症分类的准确性。
实际应用
该数据集在临床诊断和治疗推荐方面具有实际应用价值。通过精确的癌症类型标注,医生可以更准确地评估患者的病情,并提供更精准的治疗建议。此外,该数据集还可以用于训练和评估CAD系统,以提高其检测和分类性能。这有助于医生更快速地进行诊断,并提高诊断的准确性。
衍生相关工作
该数据集的发布为肺结节检测和癌症分类领域的研究提供了新的机遇。基于这个数据集,研究人员可以进一步探索和改进肺结节检测和癌症分类算法,以提高其准确性和可靠性。此外,该数据集还可以用于开发新的CAD系统,为临床诊断和治疗提供更好的支持。这将为肺结节检测和癌症分类领域的研究和应用带来新的突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作