【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
LLD-MMRI-MedSAM2
收藏Hugging Face2025-04-07 更新2025-04-08 收录
下载链接:
https://huggingface.co/datasets/wanglab/LLD-MMRI-MedSAM2
下载链接
链接失效反馈官方服务:
资源简介:
LLD-MMRI数据集包含来自498名独特患者的多种肝脏病变,包括肝细胞癌、肝内胆管癌、肝转移癌、肝囊肿、肝血管瘤、灶性结节性增生和肝脓肿等。每个病变都有八种MRI扫描:非对比、动脉期、静脉期、延迟期、T2加权成像、扩散加权成像、T1同相和T1反相,共计3984个案例。所有3984个病变都通过MedSAM2在人类参与的管道中进行了注释。
The LLD-MMRI dataset contains multiple liver lesions from 498 unique patients, including hepatocellular carcinoma, intrahepatic cholangiocarcinoma, hepatic metastases, hepatic cysts, hepatic hemangiomas, focal nodular hyperplasia, and hepatic abscesses, among others. For each lesion, eight MRI sequences are provided: non-contrast imaging, arterial phase, venous phase, delayed phase, T2-weighted imaging, diffusion-weighted imaging, T1 in-phase, and T1 out-phase, totaling 3984 cases. All 3984 lesions were annotated in a human-in-the-loop pipeline via MedSAM2.
创建时间:
2025-04-03
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,精准的肝脏病灶分割对临床诊断至关重要。LLD-MMRI-MedSAM2数据集通过整合498名患者的多样化肝脏病变数据,采用多模态MRI扫描技术获取非增强、动脉期、静脉期等八种成像序列,构建了包含3984个病例的大规模样本库。其创新性体现在采用人机协同标注流程,借助MedSAM2模型实现病灶的精细化标注,确保了数据标注的准确性与一致性。
特点
该数据集以其多模态特性脱颖而出,涵盖肝细胞癌、胆管癌等七种常见肝脏病变类型,每个病例均包含八种不同序列的MRI影像,为病灶特征分析提供了多维视角。数据规模介于1K到10K之间,兼具样本多样性与统计显著性,特别设计的结构化存储格式便于研究者快速提取所需模态的影像数据及对应标注。
使用方法
研究者可通过HuggingFace平台便捷获取该数据集,使用标准化的datasets库即可完成数据加载与分割。数据集已预置训练集划分,支持直接调用首例样本进行质量验证。为保障学术规范性,使用要求同时引用原始LLD-MMRI数据采集工作与MedSAM2标注方法两篇核心文献,配套提供的3D Slicer插件和Gradio演示程序进一步拓展了临床应用场景。
背景与挑战
背景概述
LLD-MMRI-MedSAM2数据集由多伦多大学健康网络和Vector人工智能研究所等机构的研究团队于2025年创建,旨在推动医学图像分割领域的发展。该数据集聚焦于肝脏病变的多模态MRI分析,涵盖了498名患者的3984例扫描数据,包含肝细胞癌、胆管癌、肝转移瘤等多种病变类型。研究团队采用人机协同标注流程,利用MedSAM2模型对八种不同MRI序列的病灶进行了精细标注,为三维医学图像分割算法的开发与验证提供了重要资源。
当前挑战
该数据集面临的核心挑战体现在两个维度:在医学应用层面,肝脏病变的异质性和多模态MRI图像间的配准问题对分割算法提出了极高要求;在技术实现层面,处理八种不同MRI序列的复杂数据需要克服模态差异带来的特征提取困难。数据构建过程中,研究团队需解决大规模医学图像标注的一致性问题,以及如何在保持解剖结构准确性的同时处理不同扫描协议产生的图像差异。
常用场景
经典使用场景
在医学影像分析领域,LLD-MMRI-MedSAM2数据集为肝脏病变的自动分割提供了丰富的多模态MRI数据。该数据集包含498名患者的3984例病灶标注,涵盖肝癌、肝内胆管癌、肝转移瘤等多种病变类型,为深度学习模型训练提供了多样化的样本。研究人员可利用该数据集开发精准的肝脏病灶分割算法,辅助放射科医生进行病灶定位和定量分析。
解决学术问题
该数据集有效解决了医学影像分割领域的两大核心问题:多模态影像配准不足和标注数据稀缺。通过提供八种MRI序列的精确标注,它克服了单一模态影像信息有限的缺陷,为多模态医学图像分析建立了新的基准。其大规模高质量标注显著降低了医学AI模型开发的数据门槛,推动了弱监督学习、迁移学习等前沿方法在医疗领域的应用。
衍生相关工作
基于该数据集衍生的MedSAM2模型开创了医学图像三维分割的新范式,相关成果发表在Neural Networks等顶级期刊。其提出的半自动标注流程被广泛应用于CT_DeepLesion等后续数据集的构建。团队进一步开发的3D Slicer插件和Gradio交互界面,使研究成果能快速转化为临床工具,形成了从学术研究到产业应用的完整闭环。
以上内容由遇见数据集搜集并总结生成



