H&E染色口腔鳞状细胞癌组织学图像数据集
收藏arXiv2023-01-14 更新2024-06-21 收录
下载链接:
https://data.mendeley.com/datasets/9bsc36jyrt/1
下载链接
链接失效反馈官方服务:
资源简介:
H&E染色口腔鳞状细胞癌组织学图像数据集(OCDC)由联邦大学乌贝兰迪亚分校创建,包含1020张640x640像素的组织学图像,用于支持计算机辅助诊断中的图像分割任务。数据集内容包括肿瘤区域和正常组织的手动标注图像,数据来源于口腔和颌面病理学部门的档案。创建过程中,使用Slide Scanner Aperio AT2扫描仪在20倍放大下捕获全切片图像,并从中随机提取图像补丁进行手动标注。该数据集主要应用于口腔癌的计算机视觉研究,旨在解决缺乏标注训练数据的问题,支持深度学习模型在口腔癌区域分割中的应用。
H&E stained oral squamous cell carcinoma histopathological image dataset (OCDC) was created by the Federal University of Uberlândia. It contains 1020 histopathological images with a resolution of 640×640 pixels, which is intended to support image segmentation tasks in computer-aided diagnosis. The dataset includes manually annotated images of tumor regions and normal tissues, with data sourced from the archives of the Oral and Maxillofacial Pathology Department. During the dataset construction, whole-slide images were captured at 20× magnification using the Slide Scanner Aperio AT2, and random image patches were extracted from these whole-slide images for manual annotation. This dataset is mainly applied to computer vision research on oral cancer, aiming to address the shortage of labeled training data and support the application of deep learning models in oral cancer region segmentation.
提供机构:
联邦大学乌贝兰迪亚分校
创建时间:
2023-01-14
搜集汇总
数据集介绍

构建方式
在口腔鳞状细胞癌组织病理学分析领域,高质量标注数据的稀缺性制约了计算机辅助诊断技术的发展。该数据集的构建始于从15例患者手术获取的组织样本,通过Aperio AT2玻片扫描仪在20倍放大倍数下数字化为全玻片图像。随后,从这些全玻片图像中随机提取了1020个尺寸为640×640像素的图像块。肿瘤区域的标注由专业人员在触摸屏显示器上使用GNU图像处理程序手动完成,并最终由病理学家进行严格验证,确保了像素级标注的精确性与可靠性。
特点
该数据集的核心特点在于其专注于口腔鳞状细胞癌的H&E染色组织学图像,并提供了精确的像素级肿瘤区域标注。数据集包含1020张图像,涵盖了肿瘤区域以及多种正常组织类型,如浆液性唾液腺和角化上皮组织等,为模型训练提供了丰富的形态学多样性。所有图像均以20倍放大倍数采集,具有一致的640×640像素分辨率,且已预先划分为包含840张图像的训练集和180张图像的测试集,便于研究者直接用于分割算法的开发与评估。
使用方法
该数据集主要应用于医学图像分析,特别是口腔癌区域的自动分割任务。研究人员可直接使用其提供的训练集与测试集划分,用于训练和评估卷积神经网络或全卷积网络等深度学习模型。数据集包含原始图像与对应的二值化标注掩膜,用户可通过对比模型预测结果与真实标注,量化分割性能指标。此外,该数据集也可作为基准,用于比较不同图像分割方法的有效性,推动口腔癌计算机辅助诊断工具的研发。
背景与挑战
背景概述
在数字病理学领域,苏木精-伊红(H&E)染色组织学图像的自动分析已成为辅助口腔鳞状细胞癌(OSCC)诊断的关键技术。由巴西乌贝兰迪亚联邦大学计算机科学学院、生物医学研究所及口腔颌面病理学系的研究团队于2022年创建的H&E染色口腔鳞状细胞癌组织学图像数据集,旨在解决OSCC研究中标注数据稀缺的瓶颈。该数据集包含1,020张640×640像素的图像,均源自2006年至2013年间的患者组织样本,并在20倍放大倍数下数字化。其核心研究问题聚焦于通过像素级肿瘤区域标注,推动基于深度学习的组织图像分割方法发展,从而提升病理学家诊断决策的准确性与效率,对口腔癌计算病理学领域具有重要的数据支撑价值。
当前挑战
该数据集致力于解决口腔鳞状细胞癌组织图像中肿瘤区域自动分割的挑战,其难点在于肿瘤细胞与正常组织(如唾液腺、肌肉等)在形态和纹理上高度相似,且存在异质性,导致精确边界界定困难。在构建过程中,挑战主要源于标注工作的高度专业性与复杂性:需由专家手动绘制肿瘤区域,并经病理学家验证,此过程耗时耗力;同时,全幻灯片图像包含数十亿像素,从中随机提取代表性区域并确保标注一致性,对数据质量控制提出了极高要求。
常用场景
经典使用场景
在数字病理学领域,H&E染色口腔鳞状细胞癌组织学图像数据集为肿瘤区域分割研究提供了关键资源。该数据集包含1020张640x640像素的图像,每张图像均经过专家手动标注并由病理学家验证,专门用于训练和评估深度学习模型。其经典应用场景在于支持卷积神经网络和全卷积网络等算法进行像素级肿瘤分割,帮助研究人员开发自动化诊断工具,以辅助病理学家识别口腔癌组织中的异常区域。
衍生相关工作
围绕该数据集已衍生出多项经典研究工作,例如相关论文提出的全卷积神经网络方法,实现了从口腔组织全切片图像中自动检测肿瘤区域。这些工作进一步推动了医学图像分析算法的比较与优化,激励学术界开发更高效的分割架构。同时,数据集也为跨机构合作研究提供了基准,促进了口腔癌计算病理学领域的知识积累与技术迭代。
数据集最近研究
最新研究方向
在数字病理学领域,H&E染色口腔鳞状细胞癌组织学图像数据集的发布,为深度学习驱动的肿瘤自动分割研究注入了新的活力。该数据集凭借其像素级标注的精准性,正推动着卷积神经网络与全卷积网络在口腔癌病理图像分析中的前沿探索。当前研究热点聚焦于弱监督与自监督学习策略,旨在缓解标注数据稀缺的瓶颈,同时结合多尺度特征融合与注意力机制,提升模型对肿瘤异质性的辨识能力。这些进展不仅加速了计算机辅助诊断系统的临床转化,也为口腔癌的早期筛查与个性化治疗提供了可靠的技术支撑,具有深远的学术价值与应用潜力。
相关研究论文
- 1Hematoxylin and eosin stained oral squamous cell carcinoma histological images dataset联邦大学乌贝兰迪亚分校 · 2023年
以上内容由遇见数据集搜集并总结生成



