five

LIDC-IDRI|医学影像数据集|肺部疾病诊断数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
医学影像
肺部疾病诊断
下载链接:
https://opendatalab.org.cn/OpenDataLab/LIDC-IDRI
下载链接
链接失效反馈
资源简介:
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
提供机构:
OpenDataLab
创建时间:
2022-05-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
LIDC-IDRI数据集的构建基于多中心合作,汇集了来自美国多家顶尖医疗机构的肺部CT扫描图像。该数据集的构建过程严格遵循医学影像的标准化流程,确保每一张图像的质量和诊断价值。通过邀请多位经验丰富的放射科医生对图像进行独立标注,数据集不仅包含了原始的CT图像,还涵盖了详细的注释信息,如肺结节的形态学特征和位置。这些注释经过交叉验证和一致性分析,确保了数据的高可靠性和准确性。
使用方法
LIDC-IDRI数据集广泛应用于医学影像分析和计算机辅助诊断领域。研究者可以利用该数据集进行肺结节检测、分类和分割等任务的算法开发和验证。使用时,建议首先进行数据预处理,如图像标准化和噪声过滤,以提高模型的鲁棒性。随后,可以根据具体研究目标选择合适的机器学习或深度学习模型进行训练和测试。数据集的详细注释信息为模型的评估和优化提供了宝贵的参考。
背景与挑战
背景概述
LIDC-IDRI(The Lung Image Database Consortium and Image Database Resource Initiative)数据集是由美国国家癌症研究所(NCI)主导,联合多家医学影像中心和大学共同开发的一个大型肺部影像数据库。该数据集的构建始于2005年,旨在为肺部疾病的计算机辅助诊断(CAD)研究提供高质量的影像数据。LIDC-IDRI包含了1018个病例的CT扫描图像,每个病例都经过四位放射科专家的独立标注,涵盖了肺结节的各种特征,如大小、形状和密度等。这一数据集的发布极大地推动了肺部疾病诊断技术的进步,尤其是在早期肺癌的检测和分类方面,为后续的算法开发和验证提供了宝贵的资源。
当前挑战
LIDC-IDRI数据集在构建过程中面临了多方面的挑战。首先,由于肺部CT图像的复杂性,如何确保标注的一致性和准确性是一个重要问题。四位专家的独立标注虽然提高了数据的可靠性,但也带来了标注结果的不一致性,这需要通过后处理来解决。其次,数据集中的图像分辨率和扫描参数存在差异,这增加了算法在不同设备和条件下的一致性测试难度。此外,肺结节的多样性和复杂性,如不同大小、形状和密度的结节,也对算法的泛化能力提出了高要求。最后,数据集的隐私和安全问题也是构建过程中必须考虑的重要因素,确保患者信息的保密性是数据集使用的前提。
发展历史
创建时间与更新
LIDC-IDRI数据集创建于2005年,由美国国家癌症研究所(NCI)、美国国家卫生研究院(NIH)以及多家医疗机构共同发起。该数据集在2012年进行了首次公开发布,并在随后的几年中持续更新,以确保数据的准确性和完整性。
重要里程碑
LIDC-IDRI数据集的重要里程碑包括其在2012年的首次公开发布,这一事件标志着肺部影像数据在医学研究中的广泛应用。此外,该数据集在2015年引入了新的标注标准,进一步提升了数据的质量和一致性。2017年,LIDC-IDRI数据集被纳入多个国际医学影像分析竞赛,极大地推动了相关算法的发展和应用。
当前发展情况
当前,LIDC-IDRI数据集已成为肺部影像分析领域的基准数据集,广泛应用于计算机辅助诊断(CAD)系统的开发和评估。该数据集不仅为研究人员提供了丰富的肺结节影像数据,还促进了深度学习算法在医学影像分析中的应用。此外,LIDC-IDRI数据集的开放性和标准化特性,为全球范围内的医学影像研究提供了宝贵的资源,推动了医学影像技术的进步和临床应用的普及。
发展历程
  • LIDC-IDRI数据集的构想首次提出,旨在创建一个用于肺结节检测和诊断研究的标准化数据集。
    2004年
  • 开始收集和整理来自多家医疗机构的CT扫描图像,为数据集的构建奠定基础。
    2005年
  • LIDC-IDRI数据集正式发布,包含1018个病例的CT扫描图像,每个病例由四位放射科医生独立标注。
    2007年
  • 数据集首次应用于国际肺结节检测挑战赛(Lung Nodule Analysis Challenge),推动了肺结节检测算法的发展。
    2008年
  • LIDC-IDRI数据集被广泛应用于多个医学影像分析研究项目,成为肺结节检测和诊断领域的标准数据集之一。
    2011年
  • 随着深度学习技术的发展,LIDC-IDRI数据集开始被用于训练和验证基于深度学习的肺结节检测模型。
    2015年
  • LIDC-IDRI数据集继续作为肺结节检测和诊断研究的重要资源,支持了多项前沿技术的研究和应用。
    2020年
常用场景
经典使用场景
在医学影像分析领域,LIDC-IDRI数据集被广泛用于肺结节检测与分类的研究。该数据集包含了大量的高分辨率CT扫描图像,每张图像都经过多位放射科专家的标注,提供了丰富的结节特征信息。研究者利用这些标注数据,开发和验证了多种肺结节检测算法,显著提升了早期肺癌的诊断准确率。
解决学术问题
LIDC-IDRI数据集解决了医学影像分析中肺结节检测的难题。通过提供多专家标注的CT图像,该数据集为研究者提供了一个标准化的评估平台,使得不同算法之间的性能比较成为可能。这不仅推动了肺结节检测技术的进步,还为其他医学影像分析任务提供了宝贵的参考。
实际应用
在临床实践中,LIDC-IDRI数据集的应用主要体现在辅助放射科医生进行肺结节的早期检测。通过训练和验证的算法,可以快速筛选出疑似结节的区域,减少医生的工作负担,提高诊断效率。此外,该数据集还支持开发个性化的治疗方案,为患者提供更精准的医疗服务。
数据集最近研究
最新研究方向
在医学影像分析领域,LIDC-IDRI数据集因其丰富的肺部CT图像和详细的标注信息,成为研究肺结节检测与分类的重要资源。近期研究主要集中在利用深度学习技术提升肺结节的自动检测和分类精度。通过引入多模态数据融合和迁移学习策略,研究者们致力于解决数据不平衡和标注不一致的问题,从而提高模型的泛化能力和临床应用价值。此外,随着人工智能在医疗诊断中的应用日益广泛,LIDC-IDRI数据集的研究成果对于推动精准医疗和早期癌症筛查具有重要意义。
相关研究论文
  • 1
    The Lung Image Database Consortium (LIDC) and Image Database Resource Initiative (IDRI): A Completed Reference Database of Lung Nodules on CT ScansNational Institutes of Health · 2015年
  • 2
    A Comprehensive Assessment of Radiomics in Lung Nodule Classification Using the LIDC-IDRI DatasetUniversity of California, San Francisco · 2020年
  • 3
    Deep Learning for Lung Cancer Detection Using the LIDC-IDRI DatasetStanford University · 2019年
  • 4
    Automated Lung Nodule Detection Using 3D Convolutional Neural Networks on the LIDC-IDRI DatasetMassachusetts Institute of Technology · 2018年
  • 5
    Evaluation of Machine Learning Algorithms for Lung Nodule Classification in the LIDC-IDRI DatasetHarvard Medical School · 2017年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。

www.ngac.org.cn 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录

ADNI

阿尔茨海默病神经影像研究计划 (ADNI) 是一项多站点研究,旨在改善预防和治疗阿尔茨海默病 (AD) 的临床试验。[1] 这项合作研究结合了私营和公共部门的专业知识和资金,以研究患有AD的受试者,以及那些可能发展成AD和控制没有认知障碍迹象的人。[2] 美国和加拿大63个地点的研究人员通过神经影像学,生化,和遗传生物标记。[2][3] 这些知识有助于找到更好的预防和治疗AD的临床试验。ADNI已经产生了全球性的影响,[4] 首先是通过开发一套标准化的协议,以允许对来自多个中心的结果进行比较,[4] 其次是其数据共享政策,该政策使所有数据在没有禁运的情况下提供给世界各地的合格研究人员。[5] 迄今为止,超过1000份科学出版物使用了ADNI数据。[6] 许多其他与AD和其他疾病相关的计划已经使用ADNI作为模型来设计和实施。[4] ADNI一直在2004年运行,目前2021年获得资助。

OpenDataLab 收录