five

Angelou0516/WAW-TACE

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/WAW-TACE
下载链接
链接失效反馈
官方服务:
资源简介:
WAW-TACE数据集是一个多期腹部CT数据集,包含233名未接受过治疗的肝细胞癌(HCC)患者的CT扫描数据,这些患者在华沙医科大学接受了经动脉化疗栓塞(TACE)单药治疗。数据集包括377个手工制作的肝脏肿瘤掩膜、自动生成的整个腹部器官掩膜、放射组学特征和临床结果。CT扫描分为四个阶段:预对比、晚期动脉、门静脉和延迟期。每个患者的CT扫描和掩膜文件都按照特定的命名规则存储。肿瘤掩膜经过专家验证和手动修正,被认为是金标准;器官掩膜由TotalSegmentator生成,未经手动审查,被视为银标准。数据集没有官方的训练/验证/测试分割,用户需要自行定义。

WAW-TACE is a multiphase abdominal CT dataset of 233 treatment-naive hepatocellular carcinoma (HCC) patients receiving trans-arterial chemo-embolization (TACE) monotherapy at the Medical University of Warsaw, with 377 hand-crafted liver tumor masks plus auto-generated whole-abdomen organ masks, radiomics features, and clinical outcomes. The CT scans are divided into four phases: precontrast, late arterial, portal venous, and delayed. Each patients CT scans and mask files are stored according to specific naming conventions. The tumor masks are expert-validated and manually corrected, considered as gold standard; the organ masks are generated by TotalSegmentator without manual review, treated as silver standard. The dataset has no official train/val/test split, and users need to define their own.
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
WAW-TACE数据集由华沙医科大学精心构建,旨在推动肝细胞癌(HCC)多期CT影像分析研究。数据集纳入了233例初治HCC患者接受经动脉化疗栓塞术(TACE)治疗前的多期腹部CT影像,共包含854个CT容积扫描(涵盖平扫、动脉期、门静脉期及延迟期)。肿瘤金标准掩膜由放射科医师基于TotalSegmentator初始结果手动修正,经两位资深放射科专家独立验证并实施3毫米高斯平滑处理,生成378个专家级三维分割;器官掩膜则由TotalSegmentator自动生成覆盖104个腹部区域的银标准标签。配套数据囊括临床结局、影像组学特征及详细元数据,为多维度分析提供完整支撑。
使用方法
数据集以CC-BY-4.0许可开放,可通过Zenodo仓库获取原始NIfTI格式CT影像、NRRD格式肿瘤掩膜及TotalSegmentator生成器官掩膜。数据目录清晰划分影像、掩膜与元数据子文件夹,患者ID与时相编号命承标准化规则便于自动化处理。由于未预设训练/验证/测试划分,研究者需自主设计数据拆分策略,建议基于患者级别进行分层抽样以避免数据泄漏。元数据表提供了详尽的临床信息与放射组学特征,可结合Python的pandas库高效加载,配合ITK-SNAP或SimpleITK等工具进行影像预处理与模型开发。
背景与挑战
背景概述
肝细胞癌(HCC)是全球最常见的原发性肝脏恶性肿瘤,经动脉化疗栓塞(TACE)是其重要的治疗手段。2024年,由波兰华沙医科大学Krzysztof Bartnik等研究人员联合发布的WAW-TACE数据集,作为首个专注于TACE单药治疗的HCC多期CT公开资源,填补了该领域精细化标注数据的空白。该数据集包含233例初治HCC患者的854个CT体积(涵盖平扫、动脉期、门脉期及延迟期),并提供了378个经专家手工校正的肿瘤金标准掩膜以及104个腹部器官的自动分割掩膜。WAW-TACE的推出为HCC的影像组学分析、治疗效果预测及多期CT分割算法提供了统一基准,显著推动了介入放射学与人工智能的交叉研究。
当前挑战
WAW-TACE数据集面临的核心挑战包括:其一,HCC病灶在多期CT中呈现异质性增强模式,且部分患者因呼吸运动或造影剂注射时机差异导致相位缺失,对跨期相联合分析构成严峻挑战。其二,肿瘤掩膜构建过程中需由初阶放射科医师在TotalSegmentator自动预测基础上逐例修正,再经两位资深专家独立复核,流程繁复且对专业经验依赖度高,限制了数据集规模的扩展。此外,数据集未预设官方划分标准,研究者需自行设计训练/验证/测试集拆分方案,可能引发不同工作间评估结果的可比性不足,影响模型泛化能力的客观衡量。
常用场景
经典使用场景
在肝癌诊疗的影像分析领域中,肝细胞癌(HCC)的多期CT成像对于疾病诊断、治疗方案制定及预后评估具有不可替代的价值。WAW-TACE数据集聚焦于接受经动脉化疗栓塞(TACE)单药治疗的初治HCC患者,提供了涵盖平扫、动脉期、门静脉期及延迟期的四期腹部CT影像,并附有经专家精细手工标注的肝脏肿瘤掩膜以及由自动化工具生成的全腹部器官掩膜。该数据集最经典的使用场景是作为肝脏肿瘤分割任务的基准测试平台,研究者可利用其高质量的肿瘤标注训练和验证深度学习分割模型,评估不同算法在多期影像上对HCC病灶的识别与边界描绘能力。此外,由于数据集包含了每位患者的临床结局与影像组学特征,它还可用于探索影像表型与治疗反应之间的关联性研究,为构建基于多期CT的疗效预测模型提供数据支撑。
解决学术问题
在肝癌的跨学科研究中,缺乏公开、标准化且包含完整临床信息的多期CT数据集长期制约着影像组学与深度学习方法的临床转化。WAW-TACE数据集通过系统性地采集233例TACE患者的四期CT影像、手工验证的肿瘤分割掩膜以及详细的诊疗结局,有效解决了传统数据集规模小、标注质量参差不齐、缺乏治疗背景信息等关键瓶颈。该数据集推动了三个核心学术问题的研究:一是高精度肝脏肿瘤自动分割算法的开发与公平对比,因其中部分数据包含多个肿瘤标注,能够检验算法在多病灶场景下的鲁棒性;二是影像组学特征与TACE疗效的关联分析,研究者可借助其提供的免疫组化特征和临床变量,构建预测肿瘤应答的统计模型;三是多期影像融合策略在肿瘤负荷评估中的优化,数据集的多时相特性有助于探索时序信息对分割与分类任务性能的提升机制。这些贡献不仅加深了对HCC异质性的理解,也为制定个体化TACE治疗方案提供了循证依据,具有显著的临床转化潜力。
实际应用
WAW-TACE数据集在临床诊疗与智慧医疗领域的实际应用展现出多重价值。在放射科工作流优化方面,基于该数据集训练的自动分割模型可辅助医生快速勾勒肝脏肿瘤边界,显著减少人工勾画时间,提高术前规划与疗效评估的效率。在介入放射学中,数据集提供的多期CT影像与TACE治疗结局可支撑构建预后预测系统,帮助临床医师在术前筛选出可能获益最大的患者,从而规避无效治疗并减少医疗资源浪费。此外,该数据集还适合用于医学影像教学与培训,其包含的典型HCC多期表现和精确标注可作为教学案例,帮助年轻医师掌握肿瘤识别与分期判读技能。从产业应用角度出发,WAW-TACE为医疗影像人工智能公司提供了高质量的训练资源,助力开发面向肝癌诊疗效能优化的软件即服务(SaaS)产品,推动肿瘤影像分析从科研走向临床部署。
数据集最近研究
最新研究方向
WAW-TACE数据集作为全球首个公开发布的针对肝细胞癌经动脉化疗栓塞术治疗的多期相腹部CT公开数据集,为人工智能在肝癌精准介入治疗领域的应用提供了里程碑式的资源支撑。该数据集收录了233例初治患者的854个多期相CT容积、378个经过双专家验证的高质量手动肿瘤分割标注以及104个全腹部器官自动分割掩码,同时配套丰富的影像组学特征与临床结局数据,尤其契合当前肿瘤学领域对治疗前影像生物标志物挖掘与预后预测模型构建的前沿需求。随着介入放射学与深度学习技术的深度融合,该数据集正推动着从传统形态学评估向功能影像组学驱动、多模态数据融合的个体化治疗决策范式转变,为肝癌TACE治疗反应预测、肿瘤异质性解析以及自动化评估管线开发等热点研究方向提供了标准化的训练与验证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作