five

ULS23

收藏
arXiv2024-06-08 更新2024-06-17 收录
下载链接:
uls23.grand-challenge.org
下载链接
链接失效反馈
官方服务:
资源简介:
ULS23数据集是由荷兰和德国的多个医学研究机构联合创建,专注于胸部-腹部-骨盆CT检查中的3D通用病变分割。该数据集包含38,693个病变,覆盖了胰腺、结肠和骨骼等难以分割的病变类型。数据集的创建过程涉及从临床报告中提取信息,并通过专业人员进行精确的3D分割。ULS23数据集的应用领域主要在于提高癌症治疗评估中对肿瘤表现的测量效率,通过自动化分割加速放射学工作流程,并支持更复杂的分析如放射组学特征分析,以区分不同类型的病变。

The ULS23 dataset was jointly developed by multiple medical research institutions across the Netherlands and Germany, focusing on 3D universal lesion segmentation in chest-abdominal-pelvic CT scans. This dataset contains 38,693 lesions, covering challenging lesion types such as those arising from the pancreas, colon, and skeletal tissues. The development process of the dataset involved extracting information from clinical reports and performing precise 3D segmentation by medical professionals. The primary application areas of the ULS23 dataset include improving the measurement efficiency of tumor performance during cancer treatment assessment, accelerating radiological workflows through automated lesion segmentation, and supporting more complex analyses such as radiomic feature analysis to differentiate between distinct lesion types.
提供机构:
拉德布德大学医学中心放射学与核医学系,荷兰奈梅亨;耶罗恩博斯医院放射科,荷兰斯海尔托亨博斯;格罗宁根大学医学中心放射科,荷兰格罗宁根;弗劳恩霍夫数字医学研究所MEVIS,德国不来梅
创建时间:
2024-06-08
搜集汇总
数据集介绍
构建方式
在医学影像分析领域,构建高质量的数据集对于推动通用病灶分割技术至关重要。ULS23数据集的构建采用了多源数据整合策略,通过汇集来自不同医疗中心的公开数据集,包括DeepLesion、KiTS21、LiTS等,并引入新颖的胰腺和骨骼病灶数据,形成了包含38,693个病灶的训练集。数据预处理阶段,将病灶裁剪为256x256x128体素的感兴趣体积,确保病灶中心位于体积中央,模拟放射科医生的点击标注。测试集则从临床报告中筛选出775个具有临床意义的靶病灶,由多名标注者进行三维分割,并经放射科专家审核,确保了数据的多样性和临床相关性。
特点
ULS23数据集在通用病灶分割领域展现出显著特点。其训练集融合了全标注三维分割数据和部分标注二维伪掩码数据,覆盖了胸腹盆区域的多种病灶类型,包括传统上难以分割的胰腺和骨骼病灶。数据集的异构性体现在患者人口统计学、扫描仪制造商和图像采集协议的广泛差异,这增强了模型对分布外数据的泛化能力。测试集专注于临床实践中被选为靶病灶的病例,强化了数据集的临床实用性。此外,数据集通过公开的基准平台提供,支持容器化算法提交,确保了评估的可靠性和可重复性。
使用方法
ULS23数据集的使用方法围绕其作为公开挑战基准的设计展开。研究人员可通过官方平台访问训练数据,包括全标注和部分标注病灶,并利用提供的基线半监督模型进行算法开发。数据以感兴趣体积形式提供,要求模型基于中心体素进行病灶分割。参与挑战需将算法容器化,在限定计算资源内完成推理,评估指标综合了分割性能、测量误差和一致性得分。数据集支持迭代训练策略,允许利用二维伪掩码生成三维预测以扩展训练数据。测试集保持隐藏状态,确保基准的长期可靠性,同时鼓励开源算法以促进社区协作和临床转化。
背景与挑战
背景概述
在医学影像分析领域,随着全球癌症负担的持续增长,计算机断层扫描(CT)检查量逐年攀升,放射科医生的工作负荷日益加重。为应对这一挑战,自动化的病灶分割技术成为提升诊疗效率的关键。然而,现有研究多聚焦于特定器官(如肝脏、肾脏、肺部)的病灶分割,缺乏对临床实践中广泛存在的多样化病灶类型的通用处理能力。为此,由荷兰拉德堡德大学医学中心等机构的研究团队于2023年推出了ULS23基准数据集,旨在推动三维通用病灶分割(Universal Lesion Segmentation, ULS)技术的发展。该数据集整合了胸腹盆区域的38,693个病灶,涵盖胰腺、结肠和骨骼等复杂病灶类型,并提供了包含775个临床相关病灶的测试集,为评估分割模型的泛化性能奠定了坚实基础。
当前挑战
ULS23数据集致力于解决三维通用病灶分割的核心挑战,其首要难点在于模型需在多样化的病灶形态、纹理及解剖位置中实现精准分割,尤其对于低对比度或形状不规则的病灶(如胰腺和结肠病变)分割难度显著。其次,数据构建过程面临多重困难:一方面,现有公共数据集(如DeepLesion)仅提供二维标注,难以直接用于三维模型训练;另一方面,整合多源异构数据时,需协调不同标注质量、扫描协议及患者群体的差异,同时确保临床相关性。此外,测试集的构建需模拟放射科医生的点击标注流程,并平衡病灶类型与尺寸的多样性,这对数据标注的准确性与一致性提出了极高要求。
常用场景
经典使用场景
在医学影像分析领域,ULS23数据集为三维通用病灶分割研究提供了基准平台。该数据集整合了胸腹盆CT扫描中多种类型的病灶标注,包括胰腺、结肠和骨骼等传统上难以分割的病灶类型。其经典使用场景在于评估和比较不同深度学习模型在复杂病灶分割任务上的性能,通过公开的挑战赛形式,推动算法在多样化和临床相关数据上的优化与创新。
解决学术问题
ULS23数据集主要解决了医学图像分割中通用性不足的学术难题。以往研究多集中于特定器官的病灶分割,缺乏跨病灶类型的统一模型。该数据集通过汇集大规模、多样化的三维标注数据,支持开发能够泛化至多种罕见病灶的分割算法,显著提升了模型在真实临床场景中的适应性和鲁棒性,为病灶测量与跟踪的自动化研究奠定了数据基础。
衍生相关工作
围绕ULS23数据集,已衍生出一系列经典研究工作。例如,基于半监督学习的基线模型采用nnU-Net框架,通过迭代训练利用部分标注数据生成三维伪掩码,显著提升了分割性能。同时,该数据集激发了多篇关于注意力机制、区域水平集损失和Transformer架构在病灶分割中应用的探索,如MeaFormer等模型在DeepLesion测试集上取得了领先的分割精度,推动了通用病灶分割技术的持续演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作