five

Multi-OSCC

收藏
arXiv2025-07-22 更新2025-08-14 收录
下载链接:
https://github.com/guanjinquan/OSCC-PathologyImageDataset
下载链接
链接失效反馈
官方服务:
资源简介:
Multi-OSCC 数据集是一个包含 1325 名口腔鳞状细胞癌患者的组织病理学图像数据集,旨在用于口腔鳞状细胞癌的诊断和预后。该数据集包含了来自不同组织切片的高分辨率组织病理学图像,每个患者有 6 张图像,覆盖了肿瘤的核心和边缘区域。这些图像在 ×200、×400 和 ×1000 倍率下拍摄,每倍率下两张图像。数据集还包含了 6 个关键临床任务的注释,包括复发预测、淋巴结转移、肿瘤分化、肿瘤浸润、癌症栓塞和神经周围浸润。该数据集为研究人员提供了一个全面的资源,用于多目标分析,并有助于推动口腔鳞状细胞癌的计算机辅助诊断和预后研究。

The Multi-OSCC dataset is a histopathological image dataset encompassing 1325 patients with oral squamous cell carcinoma, designed for the diagnosis and prognosis of oral squamous cell carcinoma. It contains high-resolution histopathological images sourced from various tissue sections, with 6 images per patient covering both the core and peripheral regions of the tumor. These images are captured at ×200, ×400 and ×1000 magnifications, with two images available for each magnification. The dataset also provides annotations for six critical clinical tasks, including recurrence prediction, lymph node metastasis, tumor differentiation, tumor invasion, cancer emboli and perineural invasion. This dataset offers researchers a comprehensive resource for multi-target analysis, and helps advance computer-aided diagnosis and prognosis research on oral squamous cell carcinoma.
提供机构:
南方科技大学软件工程学院, 中山大学附属口腔医院口腔颌面外科, 阿联酋阿布扎比 Mohamed Bin Zayed 人工智能大学, 澳大利亚阿德莱德大学计算机科学学院
创建时间:
2025-07-22
搜集汇总
数据集介绍
main_image_url
构建方式
Multi-OSCC数据集构建采用了高倍率组织病理学图像采集方法,涵盖了1325名口腔鳞状细胞癌(OSCC)患者的样本。每位患者的数据包括六张高分辨率图像,分别以×200、×400和×1000的放大倍数拍摄,覆盖肿瘤核心和边缘区域。数据采集过程严格遵循临床标准,由专业病理学家进行标注,确保了数据的准确性和可靠性。
使用方法
Multi-OSCC数据集的使用方法包括单任务和多任务学习框架。研究人员可以利用数据集提供的多放大倍数图像和多任务标注,进行模型训练和评估。数据集还支持多种特征融合方法和优化算法,如GradNorm和Pareto优化,以提升模型性能。此外,数据集还提供了详细的统计分析和可视化工具,便于研究人员进行深入分析。
背景与挑战
背景概述
Multi-OSCC数据集由华南理工大学软件工程学院、中山大学附属孙逸仙纪念医院口腔颌面外科及阿联酋穆罕默德·本·扎耶德人工智能大学等机构的研究团队于2025年发布,旨在解决口腔鳞状细胞癌(OSCC)诊断与预后分析中的关键问题。该数据集包含1,325例患者的病理图像,涵盖×200、×400和×1000三种放大倍率下的核心与边缘肿瘤区域图像,并标注了复发预测(REC)、淋巴结转移(LNM)等六项临床任务。其创新性在于首次整合多任务标签与多切片图像,弥补了现有OSCC数据集在患者规模与任务多样性上的不足,为开发泛化性强的AI模型提供了重要资源。
当前挑战
Multi-OSCC数据集面临双重挑战:在领域问题层面,需同时优化诊断(如肿瘤分化分级)与预后(如复发预测)任务的性能平衡,而两者对图像特征的依赖存在差异(如颜色敏感性);在构建层面,高分辨率病理图像(2592×1944像素)的处理对计算资源提出极高要求,且多切片特征融合(如核心与边缘区域)需解决信息冗余与互补性问题。此外,染色标准化虽提升诊断任务效果,却导致预后任务性能下降,凸显了预处理策略的复杂性。
常用场景
经典使用场景
Multi-OSCC数据集在口腔鳞状细胞癌(OSCC)的诊断和预后研究中具有重要应用。该数据集通过整合1325名患者的高分辨率病理图像,覆盖了从核心到边缘的肿瘤区域,并在不同放大倍数(×200、×400、×1000)下捕获图像,为研究者提供了丰富的多尺度病理信息。其经典使用场景包括通过深度学习模型进行肿瘤复发预测(REC)、淋巴结转移(LNM)、肿瘤分化(TD)等六项关键临床任务的自动化分析。
解决学术问题
Multi-OSCC数据集解决了现有OSCC数据集中患者队列规模有限、任务单一的问题。通过提供多任务标签和多区域病理图像,该数据集支持研究者开发更全面、泛化能力更强的模型。例如,其基准测试中最佳模型的AUC在REC任务中达到94.72%,在TD任务中达到81.23%,显著提升了OSCC诊断和预后的自动化水平。此外,数据集还揭示了染色归一化对诊断和预后任务的不同影响,为后续研究提供了重要参考。
实际应用
在实际临床应用中,Multi-OSCC数据集为医生提供了强大的辅助工具。例如,通过LNM任务的预测结果,医生可以更准确地判断是否需要进一步进行颈部淋巴结清扫手术,从而减少不必要的手术创伤。同时,TD、TI、CE和PI任务的自动化分析帮助医生快速评估肿瘤的严重程度,优化治疗方案。这些应用显著提高了临床决策的效率和准确性,为患者提供了更个性化的治疗选择。
数据集最近研究
最新研究方向
Multi-OSCC数据集作为口腔鳞状细胞癌(OSCC)诊断与预后的高倍率病理图像资源,近期研究聚焦于多任务学习框架的优化与跨模态特征融合。针对其六项临床任务(复发预测、淋巴结转移等),前沿探索集中在三个方面:一是基于病理特异性预训练视觉编码器(如Hibou、CONCH)的迁移学习,显著提升模型在TD任务中81.23%的AUC性能;二是染色归一化技术的任务敏感性研究,发现其对预后任务REC产生负面影响(AUC下降6.61%),却提升诊断任务平均性能3.2%;三是多目标平衡算法的创新,GradNorm等动态加权策略虽将多任务平均AUC维持在71.82%,但仍面临3.34%的性能gap,凸显临床多指标协同建模的复杂性。该数据集通过整合1325例患者的跨区域多倍率图像,为AI驱动的一体化OSCC诊疗系统开发提供了首个公开基准。
相关研究论文
  • 1
    A High Magnifications Histopathology Image Dataset for Oral Squamous Cell Carcinoma Diagnosis and Prognosis南方科技大学软件工程学院, 中山大学附属口腔医院口腔颌面外科, 阿联酋阿布扎比 Mohamed Bin Zayed 人工智能大学, 澳大利亚阿德莱德大学计算机科学学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作