five

UniToPatho

收藏
arXiv2021-02-10 更新2024-06-21 收录
下载链接:
https://ieee-dataport.org/open-access/unitopatho
下载链接
链接失效反馈
官方服务:
资源简介:
UniToPatho是由都灵大学创建的高分辨率注释数据集,包含9536个从292张全切片图像中提取的H&E染色补丁,用于训练深度神经网络进行结直肠息肉的分类和腺瘤异型增生分级。数据集内容包括不同类型的结直肠息肉样本,大小不一,数据量丰富,来源于癌症筛查中的患者。创建过程涉及从全切片图像中提取关键补丁,并由专家进行注释。该数据集主要应用于自动化结直肠息肉特征分析,旨在提高诊断准确性和效率。

UniToPatho is a high-resolution annotated dataset developed by the University of Turin. It comprises 9536 H&E-stained patches extracted from 292 whole-slide images, and is tailored for training deep neural networks to conduct colorectal polyp classification and adenoma dysplasia grading. The dataset encompasses colorectal polyp samples of diverse types and varying sizes, with a large volume of data sourced from patients undergoing cancer screening. The dataset construction process entails extracting critical patches from whole-slide images and performing expert annotations. This dataset is primarily utilized for automated colorectal polyp feature analysis, with the objective of improving diagnostic accuracy and efficiency.
提供机构:
都灵大学
创建时间:
2021-01-25
搜集汇总
数据集介绍
main_image_url
构建方式
UniToPatho 数据集的构建主要针对结直肠息肉的分类和腺瘤异型性分级。该数据集由 292 张全切片图像组成,每张图像都由专家病理学家根据六类进行注释:正常组织、增生性息肉、管状腺瘤高分级、管状腺瘤低分级、绒毛管状腺瘤高分级和绒毛管状腺瘤低分级。从这些全切片图像中提取了 9536 个苏木精和伊红 (H&E) 染色区域,这些区域按照不同的尺度进行裁剪,以便训练深度神经网络。数据集按照 70% 和 30% 的比例分为训练集和测试集。
特点
UniToPatho 数据集的特点在于其高分辨率和多样性。它包含了来自 292 张全切片图像的 9536 个 H&E 染色区域,涵盖了结直肠息肉的六种主要类型和腺瘤异型性分级。数据集的多样性和高分辨率使其成为训练深度神经网络进行结直肠息肉分类和腺瘤异型性分级的理想选择。
使用方法
使用 UniToPatho 数据集进行训练时,首先需要将数据集下载并解压。然后,可以使用标准的深度学习框架,例如 TensorFlow 或 PyTorch,加载并预处理数据集。数据集的预处理包括将图像裁剪为指定的尺度、归一化像素值等。接下来,可以使用深度学习模型进行训练和测试。最后,可以使用测试集评估模型的性能,并进行必要的调整。
背景与挑战
背景概述
结直肠癌息肉的病理学特征描述对于患者管理和随访至关重要,其最终目的是避免或及时发现侵袭性癌变。结直肠癌息肉的特征描述依赖于对组织样本的组织学分析,以确定息肉的恶性和异型程度。深度神经网络在医疗模式识别方面取得了卓越的准确性,但它们需要大量标注的训练图像。本文介绍了UniToPatho数据集,这是一个包含9536个苏木精和伊红(H&E)染色的组织切片,用于训练深度神经网络以对结直肠癌息肉进行分类和腺瘤异型程度分级。该数据集由都灵大学的计算机科学系和医学科学系的研究人员创建,旨在推动结直肠癌息肉的自动化特征描述。UniToPatho数据集的发布对于结直肠癌病理学领域具有重要意义,为深度学习算法的训练提供了宝贵的数据资源,并有助于提高结直肠癌息肉的诊断准确性。
当前挑战
UniToPatho数据集面临的挑战主要包括:1)结直肠癌息肉分类和腺瘤异型程度分级需要大量标注的训练图像,而高质量的标注数据集相对稀缺;2)不同类型的息肉在不同的尺度下具有最佳的分类准确性,因此需要采用多尺度方法来提高分类性能;3)腺瘤异型程度分级需要保留细胞核等细节信息,而图像下采样可能会丢失这些重要的特征,因此需要采用不进行下采样的方法来提高分级准确性。为了解决这些挑战,UniToPatho数据集采用了多分辨率深度学习方法,该方法使用级联分类器对息肉类型和腺瘤异型程度进行分类,并在不同尺度下提取特征,从而提高了分类和分级的准确性。
常用场景
经典使用场景
在消化系统病理学领域,UniToPatho数据集被广泛应用于深度学习模型的训练,旨在实现结直肠息肉的分类和腺瘤异型增生的分级。该数据集提供了9536个来自292张全切片图像的苏木精和伊红(H&E)染色图像块,覆盖了正常组织、增生性息肉、腺瘤(包括管状腺瘤和绒毛管状腺瘤)及其异型增生程度(低级别和高级别)。研究者可以利用UniToPatho数据集训练深度神经网络,以实现对结直肠息肉类型的自动分类和腺瘤异型增生程度的评估,从而辅助病理学家进行临床诊断。
解决学术问题
UniToPatho数据集的建立旨在解决当前结直肠息肉病理学诊断中存在的专家间一致性较差的问题。传统的病理学诊断依赖于病理学家对组织切片的观察和经验判断,而不同专家之间的诊断结果可能存在较大差异。UniToPatho数据集通过提供大规模的标注数据,为深度学习模型的训练提供了基础,有助于提高模型在结直肠息肉分类和腺瘤异型增生分级方面的准确性。此外,UniToPatho数据集还展示了不同类型的息肉在不同分辨率下具有最佳分类效果的现象,为多分辨率深度学习方法的提出提供了实验依据。
衍生相关工作
UniToPatho数据集的发布推动了结直肠息肉病理学领域深度学习研究的发展。基于UniToPatho数据集,研究者们提出了多种深度学习模型,并取得了显著的性能提升。例如,一些研究利用UniToPatho数据集训练了多分辨率深度学习模型,通过在不同分辨率下提取特征并进行分类,实现了对结直肠息肉类型和腺瘤异型增生程度的准确识别。此外,UniToPatho数据集还被用于开发可解释的深度学习模型,帮助病理学家理解模型的决策过程,提高模型的透明度和可信度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作