five

wanglab/LUNA25-MedSAM2

收藏
Hugging Face2025-07-07 更新2025-07-05 收录
下载链接:
https://hf-mirror.com/datasets/wanglab/LUNA25-MedSAM2
下载链接
链接失效反馈
官方服务:
资源简介:
LUNA25-MedSAM2数据集是一个基于LUNA25挑战的医学图像数据集,包含6163个经过MedSAM2算法标注的肺结节。该数据集用于医学图像分割任务,用户可以通过HuggingFace的datasets库加载该数据集。

The LUNA25-MedSAM2 dataset is a medical image dataset based on the LUNA25 challenge, containing 6163 lung nodules annotated with the MedSAM2 algorithm. This dataset is used for medical image segmentation tasks and can be loaded via the HuggingFace datasets library.
提供机构:
wanglab
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,肺结节分割是肺癌早期诊断的关键环节。LUNA25-MedSAM2数据集的构建依托于LUNA25挑战赛的公开数据,其过程融合了自动化分割与人工精校的双重策略。具体而言,研究团队首先运用MedSAM2 Lesion CT分割模型,对全部6163个肺结节进行基于点提示的初始分割。随后,为确保标注的精确性,对约880个分割结果进行了细致的人工审查与修正,从而在高效自动化的基础上,嵌入了专家级的质量控制,最终形成了这一高质量的三维医学影像分割数据集。
特点
该数据集的核心特征在于其专为三维医学影像分割任务设计,全面覆盖了LUNA25挑战赛中的所有肺结节实例。其标注质量尤为突出,不仅利用了前沿的MedSAM2模型进行初步处理,更通过大量人工修订确保了分割掩模的边界准确性与临床可靠性。数据集遵循CC-BY-NC-4.0许可协议,为非商业研究提供了丰富的资源。作为MedSAM2项目生态的一部分,它与同系列的其他医学影像数据集相辅相成,共同推动了通用医学影像分割模型的发展与应用。
使用方法
对于希望利用该数据集的研究者,可通过Hugging Face Hub便捷获取。使用官方提供的Python代码片段,调用`snapshot_download`函数即可将数据集下载至本地指定目录。数据集主要用于训练和评估医学影像分割模型,特别是针对CT影像中的肺结节分割任务。研究者可将其与MedSAM2等模型结合,探索提示式分割、模型微调或算法性能基准测试。若遇下载限制,通过命令行工具进行身份验证即可提升速率,保障研究流程的顺畅进行。
背景与挑战
背景概述
在医学影像分析领域,肺结节分割是肺癌早期筛查与诊断的核心环节,对提升计算机辅助诊断系统的精准度至关重要。LUNA25-MedSAM2数据集由多伦多大学健康网络AI协作中心、向量研究所及哈佛大学医学院等机构的Bo Wang教授团队于2025年构建,其依托LUNA25挑战赛的公开影像数据,运用先进的MedSAM2模型对全部6163个肺结节进行了精细化标注。该数据集旨在推动三维医学影像分割技术的前沿探索,通过结合自动化模型与人工修订,为肺癌智能诊断研究提供了高质量、大规模的标准数据资源,显著促进了医学人工智能在临床实践中的应用深化。
当前挑战
该数据集致力于解决三维医学影像中肺结节自动分割的复杂挑战,其核心难点在于结节形态的异质性、边界模糊性以及与周围组织的低对比度,这些因素常导致传统分割方法精度不足。在构建过程中,研究团队面临双重困难:一方面,需设计高效的交互式标注流程,先利用MedSAM2模型进行点提示初始分割,再对约880个结果进行人工修订,以平衡标注效率与质量;另一方面,医学影像数据本身存在隐私保护、格式标准化及多中心数据一致性等固有难题,对数据集的可靠性与泛化能力构成了持续考验。
常用场景
经典使用场景
在医学影像分析领域,肺结节分割是计算机辅助诊断系统的核心任务之一。LUNA25-MedSAM2数据集通过提供超过六千个经过精细标注的肺结节分割掩膜,为研究人员构建和评估先进的医学图像分割模型奠定了坚实基础。该数据集典型地用于训练和验证能够自动识别与分割肺部CT影像中结节区域的深度学习算法,尤其在探索基于提示的交互式分割范式方面展现出显著价值。其标注流程融合了自动化模型初筛与人工修正,确保了标注质量与效率的平衡,为模型在复杂医学影像上的泛化性能提供了可靠基准。
衍生相关工作
围绕LUNA25-MedSAM2数据集,学术界已催生了一系列富有影响力的研究工作。其核心关联的MedSAM2模型本身便是一项里程碑式的成果,它扩展了视觉基础模型在三维医学影像与视频分割中的能力边界。该数据集作为LUNA25挑战赛的重要组成部分,直接激励了全球研究团队开发更精准、更高效的肺结节自动检测与分割算法。这些竞赛成果及后续研究不断刷新着该领域的性能上限,并进一步推动了如少样本学习、弱监督分割以及模型可解释性等前沿方向的探索,形成了以高质量数据驱动医学人工智能创新的良性循环。
数据集最近研究
最新研究方向
在医学影像分析领域,肺结节分割是肺癌早期诊断与精准治疗的关键环节。LUNA25-MedSAM2数据集作为LUNA25挑战赛的衍生资源,其前沿研究聚焦于三维医学图像与视频的通用分割技术。该数据集通过集成MedSAM2模型,实现了对六千余个肺结节的高质量自动标注与人工精修,为探索大模型在三维医学影像中的零样本与少样本学习能力提供了重要基准。当前热点研究围绕如何利用此类标注数据,进一步优化基础模型的泛化性能,以应对多模态、多中心临床数据的复杂性与异质性,推动计算机辅助诊断系统向更高效、更可靠的方向演进,对提升肺癌筛查的自动化水平具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作