LaryngealCT
收藏arXiv2025-10-13 更新2025-11-19 收录
下载链接:
https://github.com/funzi-son/LaryngealCT
下载链接
链接失效反馈官方服务:
资源简介:
LaryngealCT 数据集是一个关于喉癌的标准化深度学习模型开发的数据集,包含了从TCIA中六个集合聚合的1029个CT扫描数据。该数据集提供了包含喉部的1mm各向同性感兴趣区域,并具有全面的元数据和专家验证的数据处理。该数据集用于在早期(Tis-T2)与晚期(T3-T4)以及T4与非T4分类任务中对3D深度学习架构进行基准测试,以支持临床决策。
The LaryngealCT dataset is a standardized dataset developed for deep learning model development related to laryngeal cancer. It contains 1029 CT scan cases aggregated from six collections within TCIA. This dataset provides 1mm isotropic regions of interest (ROIs) encompassing the larynx, along with comprehensive metadata and expert-validated data processing pipelines. It is designed to benchmark 3D deep learning architectures for two classification tasks: distinguishing early-stage (Tis-T2) from advanced-stage (T3-T4) laryngeal cancer, and differentiating T4 from non-T4 cases, to support clinical decision-making.
提供机构:
Deakin University, Australia and Kasturba Medical College, Manipal, India
创建时间:
2025-10-13
搜集汇总
数据集介绍

构建方式
在喉癌影像研究领域,数据标准化一直是制约深度学习模型发展的关键瓶颈。LaryngealCT数据集通过系统整合癌症影像档案库中六个公开CT集合,构建了包含1029例计算机断层扫描的标准化基准。采用弱监督参数搜索框架提取喉部统一1毫米各向同性感兴趣区域,所有裁剪参数均经过临床专家验证,确保解剖结构的精确覆盖与数据处理的高度可重复性。
使用方法
在临床应用层面,该数据集支持两种关键分类任务的深度学习方法验证:早期与晚期分期鉴别以及T4与非T4分类决策。研究团队建立了包含823例训练集和206例独立测试集的标准划分方案,并采用5折分层交叉验证确保模型评估的稳健性。通过开源代码库提供完整的预处理工具链和训练流程,使研究者能够复现所有实验并开展新的算法探索。
背景与挑战
背景概述
喉癌作为头颈部常见恶性肿瘤,其精确分期对治疗决策具有关键意义。LaryngealCT数据集由Deakin大学与印度Kasturba医学院联合团队于2023年构建,汇聚了来自癌症影像档案馆六个独立队列的1029例计算机断层扫描影像。该数据集通过弱监督参数搜索框架提取了标准化喉部感兴趣区域,建立了首个专注于喉癌分期的三维深度学习基准数据库,为解决该领域缺乏标准化数据的瓶颈提供了重要基础设施。
当前挑战
在喉癌分期领域,深度学习模型需应对早期与晚期肿瘤的形态学差异辨识,以及T4期软骨浸润的细微特征捕捉两大核心难题。数据集构建过程中面临多中心数据异构性整合挑战,包括扫描协议差异、对比剂使用不一致等问题。同时,T4病例仅占总数8.2%的类别不平衡现象,以及原始影像视野过大导致喉部区域精准定位困难,均为数据标准化处理带来显著技术障碍。
常用场景
经典使用场景
在喉癌影像学研究领域,LaryngealCT数据集为深度学习模型开发提供了标准化的评估基准。该数据集通过整合来自癌症影像档案馆六个独立数据集的1029例计算机断层扫描影像,构建了统一的1毫米各向同性喉部感兴趣区域。研究人员利用这一数据集对多种三维深度学习架构进行系统性评估,包括在早期与晚期喉癌分期分类任务中验证3D CNN模型达到0.881的曲线下面积,以及在T4与非T4分类任务中ResNet18模型取得0.892的优异表现。这种标准化的评估框架为喉癌影像分析建立了可重复的实验范式。
解决学术问题
LaryngealCT数据集有效解决了喉癌影像研究中长期存在的样本量不足与数据标准化缺失的学术难题。通过提供经过临床专家验证的预处理流程和全面的元数据标注,该数据集支持研究者开展可重复的深度学习模型开发。特别在解决类别不平衡问题上,数据集通过分层抽样和焦点损失函数优化,为T4这类罕见但临床关键的病例分类提供了可靠的研究基础。其开放的裁剪参数和标准化流程更突破了以往研究中单中心数据局限,显著提升了喉癌AI研究的泛化能力与临床转化价值。
实际应用
在临床实践层面,LaryngealCT数据集为喉癌精准诊疗提供了重要的技术支撑。基于该数据集训练的深度学习模型能够辅助放射科医生进行喉癌T分期评估,特别是在鉴别甲状腺软骨侵犯等关键临床决策点上提供量化参考。数据集整合的Grad-CAM++可解释性分析工具,使模型预测结果能够与喉部解剖结构建立直观关联,增强了临床医生对AI决策的信任度。这种技术集成有望优化喉癌治疗方案的制定流程,为选择保喉手术或全喉切除术提供更可靠的影像学依据。
数据集最近研究
最新研究方向
在喉癌影像学领域,LaryngealCT数据集的推出标志着标准化深度学习模型开发的重要进展。该数据集整合了来自六个公开CT集合的1029个扫描样本,通过弱监督参数搜索框架提取了统一的喉部各向同性体积,为三维深度学习架构的基准测试提供了可靠基础。前沿研究聚焦于早期与晚期喉癌分期分类及T4与非T4鉴别任务,其中定制3D CNN和ResNet18在性能上显著优于更深层网络,凸显了在样本有限条件下轻量级架构的临床优势。热点方向包括模型可解释性分析,如Grad-CAM++可视化揭示了非T4病例中软骨周围注意力集中现象,以及通过扰动实验验证了解剖学相关性。这些研究不仅推动了AI在喉癌分期中的可重复性发展,还为临床决策支持提供了透明、可推广的基础,深刻影响着肿瘤影像学从数据驱动到临床应用的转化路径。
相关研究论文
- 1通过Deakin University, Australia and Kasturba Medical College, Manipal, India · 2025年
以上内容由遇见数据集搜集并总结生成



