five

universal-lesion-segmentation

收藏
Hugging Face2026-02-10 更新2026-02-11 收录
下载链接:
https://huggingface.co/datasets/nielsRocholl/universal-lesion-segmentation
下载链接
链接失效反馈
官方服务:
资源简介:
Universal Lesion Segmentation Datasets 是一个包含多个医学影像数据集的集合,专门用于病灶分割相关研究。该数据集的特点是每个子数据集都有独立的许可证,用户在使用前必须检查具体子数据集文件夹中的许可证文件(如 LICENSE 文件),不能假设所有数据集适用同一许可证。由于 README 未提供具体数据内容描述,建议用户进一步查阅各子数据集的文档以获取详细信息。
创建时间:
2026-02-09
原始信息汇总

Universal Lesion Segmentation Datasets (ULS++) 数据集概述

数据集简介

Universal Lesion Segmentation Datasets (ULS++) 是一个用于CT扫描中病灶分割的公共医学影像数据集集合。数据集按原始来源下载的格式提供。

包含的数据集

该仓库包含以下数据集:

  • CECT - 肝脏(原发性)。用于原发性肝癌的综合多期相3D对比增强CT成像。
  • CLM - 肝脏(转移性)。包含接受结直肠肝转移瘤切除术患者的术前CT和生存数据。
  • kits21 - 肾脏肿瘤分割。用于肾脏和肾肿瘤在对比增强CT成像中的分割。
  • lidc - 肺结节。包含CT扫描中肺结节的完整参考数据库。
  • lits - 肝脏肿瘤分割。肝脏肿瘤分割基准。
  • LNDb - 肺结节。包含CT扫描中的肺结节数据库。
  • Longitudinal-CT - 全身。包含手动标注肿瘤病灶的全身FDG-PET/CT数据集。
  • MSD - 全身。医学分割十项全能数据集。
  • MSWAL - 腹部。用于全腹部病灶的3D多类别分割数据集。
  • tcia_ct_lymph_nodes - 淋巴结。用于使用深度卷积神经网络随机集进行淋巴结检测的数据集。
  • WAW-TACE - 肝脏(原发性)。包含分割、影像组学特征和临床数据的肝细胞癌多期相CT数据集。
  • WORC - GIST胃肠道和CRLM肝转移。包含来自六项影像组学研究的930名患者的MRI和CT扫描、分割及临床标签。

数据格式

数据集以其原始格式(主要为NIfTI .nii.gz,部分为NRRD)按原样提供。每个数据集文件夹包含的数据文件与原始来源分发的完全一致。

许可证

重要提示:每个数据集均有其独立的许可证。

  • 使用任何数据前,请检查每个数据集文件夹中的 LICENSE 文件。
  • 许可证类型多样(包括CC BY、CC BY-SA、CC BY-NC、CC BY-NC-SA、CC BY-NC-ND等)。
  • 请勿假定单一许可证适用于整个集合。
  • 使用前务必核实许可证合规性。

使用说明

数据集按原样提供。如有问题,请参考原始数据集来源或在本仓库提交问题。

搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,构建高质量的数据集对于推动病灶分割算法的进步至关重要。Universal Lesion Segmentation Datasets (ULS++) 是一个精心整合的公共医学影像数据集集合,专门针对CT扫描中的病灶分割任务。该数据集的构建并非从头创建新数据,而是系统性地汇集了多个已公开发布且经过同行评议的权威医学影像数据集,例如来自KiTS19挑战赛的肾脏肿瘤数据、LIDC-IDRI的肺结节数据以及Medical Segmentation Decathlon的全身多器官数据等。每个子数据集均保持了其原始发布时的格式与结构,主要以NIfTI或NRRD等标准医学影像格式存储,确保了数据的完整性与可追溯性。这种集成方式旨在为研究者提供一个统一、便捷的访问入口,以支持大规模、多病灶类型的算法开发与评估。
使用方法
使用该数据集时,研究者需首先明确其集成性质。每个子数据集均以独立文件夹形式存放,内部包含原始的影像文件与对应的分割标注文件。用户需要根据具体研究目标,选择相应的子集进行加载和处理,通常需要借助如NiBabel、SimpleITK等支持NIfTI格式的医学影像处理库。由于数据格式与标注标准不一,进行联合训练或评估前,可能需要进行一定的数据预处理与标准化操作,例如图像重采样、强度归一化或标签映射。至关重要的是,在使用任何子集数据前,必须仔细查阅其文件夹内的许可证文件,确保使用方式符合CC BY、CC BY-NC等具体条款的规定,以保障研究的合规性与伦理性。
背景与挑战
背景概述
在医学影像分析领域,精准分割CT扫描中的病灶区域对于癌症诊断与治疗规划至关重要。Universal Lesion Segmentation Datasets(ULS++)作为一个集成性公开数据集,由多个研究机构于2020年代初期至中期共同构建,旨在为病灶分割任务提供标准化、多样化的三维CT影像资源。该数据集汇聚了来自肝脏、肾脏、肺部及全身等多部位病灶的标注数据,核心研究问题聚焦于提升自动化分割算法在复杂临床场景中的泛化能力与鲁棒性,对推动计算机辅助诊断系统的技术进步具有显著影响力。
当前挑战
该数据集致力于解决医学影像中病灶分割的共性挑战,包括病灶形态的高度异质性、与周围组织的低对比度以及多尺度特征融合难题。在构建过程中,面临跨数据集标注标准不统一、影像采集协议差异导致的域偏移问题,以及多中心数据整合时隐私保护与伦理合规性要求。此外,三维CT数据的体素级精细标注需耗费大量专业人力,且不同病灶类型(如原发与转移性肿瘤)的语义一致性维护亦构成显著挑战。
常用场景
经典使用场景
在医学影像分析领域,Universal Lesion Segmentation Datasets(ULS++)作为一项综合性资源,其经典使用场景聚焦于三维CT图像中的病灶分割任务。该数据集整合了多个公开医学影像库,涵盖肝脏、肾脏、肺部及全身等多部位病灶,为研究人员提供了标准化的数据基准。通过利用这些高质量标注的CT扫描图像,学者们能够训练和验证深度学习模型,实现从复杂背景中精确识别并勾勒病灶边界,从而推动自动分割技术的发展。
解决学术问题
该数据集有效解决了医学影像分析中的若干关键学术问题,包括跨模态病灶分割的泛化性挑战、小样本学习下的模型鲁棒性提升,以及多中心数据异质性的统一处理。通过提供大规模、多来源的标注数据,ULS++促进了分割算法在真实临床环境中的性能评估,减少了模型过拟合风险。其意义在于为病灶分割研究建立了可重复的实验基准,加速了从理论模型到临床应用的转化进程。
实际应用
在实际临床应用中,ULS++数据集支撑了计算机辅助诊断系统的开发,特别是在肿瘤筛查、治疗规划与疗效评估等环节。基于该数据训练的模型能够辅助放射科医生快速定位CT图像中的可疑病灶,提升诊断效率与一致性。此外,这些数据还可用于构建个性化医疗工具,如手术导航系统和放射治疗靶区勾画,为精准医疗提供可靠的技术基础。
数据集最近研究
最新研究方向
在医学影像分析领域,通用病灶分割数据集(ULS++)的整合为三维CT图像中的病灶自动分割研究提供了关键支持。当前前沿研究聚焦于多模态与跨数据集泛化能力的提升,通过融合不同解剖部位(如肝脏、肺部、肾脏)的异构数据,推动模型在复杂临床场景中的适应性。热点事件包括利用深度学习框架进行弱监督或半监督学习,以应对标注数据稀缺的挑战,同时结合生成式人工智能技术合成高质量训练样本,增强分割精度与鲁棒性。这些进展不仅加速了辅助诊断系统的开发,也为肿瘤定量评估与疗效监测奠定了数据基础,对推动精准医疗具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作