GasHisSDB
收藏arXiv2021-11-02 更新2024-06-21 收录
下载链接:
https://gitee.com/neuhwm/GasHisSDB.git
下载链接
链接失效反馈官方服务:
资源简介:
GasHisSDB是由东北大学等机构合作开发的胃癌组织病理学图像数据库,包含245,196张正常和异常的胃癌病理图像。数据集通过H&E染色技术获取,图像分为三个子数据库,分别对应不同的图像尺寸。该数据集旨在支持胃癌的计算机辅助诊断研究,特别是在弱监督学习领域,为研究人员提供了丰富的图像资源以探索新的诊断算法,从而辅助医生在临床实践中提高诊断效率和准确性。
GasHisSDB is a gastric cancer histopathological image database developed collaboratively by Northeastern University and other institutions. It contains 245,196 normal and abnormal gastric cancer histopathological images. The dataset is acquired via H&E staining technology, and the images are divided into three sub-databases corresponding to different image sizes. This dataset aims to support computer-aided diagnosis research on gastric cancer, especially in the field of weakly supervised learning, providing researchers with abundant image resources to explore new diagnostic algorithms, thereby assisting clinicians in improving diagnostic efficiency and accuracy in clinical practice.
提供机构:
东北大学
创建时间:
2021-06-04
搜集汇总
数据集介绍

构建方式
GasHisSDB数据集的构建基于公开的胃癌病理图像数据库,由多位专家参与制作。数据集包含245,196张亚尺寸图像,分为正常和异常两类,旨在评估分类器的性能。数据集的准备过程包括从原始图像中裁剪出亚尺寸图像,并由经验丰富的病理学家进行校准。此外,数据集还进行了随机旋转和图像顺序打乱,以减少同源图像之间的相关性。
特点
GasHisSDB数据集的特点在于其包含了大量的亚尺寸病理图像,适用于弱监督学习。数据集中的每张图像都计算了三种不同的特征,包括颜色直方图、局部二值模式(LBP)和灰度共生矩阵(GLCM),这些特征为分类器的评估提供了丰富的信息。此外,数据集的公开性使得研究人员可以自由访问和使用,推动胃癌计算机辅助诊断算法的发展。
使用方法
GasHisSDB数据集的使用方法主要包括特征提取和分类器评估。研究人员可以利用数据集中的图像和特征,训练和测试不同的机器学习和深度学习分类器,如随机森林(RF)、线性支持向量机(linear SVM)、VGG16、ResNet50和ViT等。通过对比不同分类器在数据集上的表现,可以评估和优化算法,从而提高胃癌病理图像的分类准确性和诊断效率。
背景与挑战
背景概述
胃癌已成为全球第五大常见癌症,早期检测对于挽救生命至关重要。组织病理学检查是胃癌诊断的金标准,但由于公开可用的胃组织病理学图像数据集的稀缺性,计算机辅助诊断技术的评估面临挑战。为此,由东北大学、中国医科大学附属肿瘤医院等机构的研究人员组成的团队,于2021年开发了GasHisSDB数据集。该数据集包含245,196张胃组织病理学子图像,分为正常和异常两类,旨在评估分类器的性能。GasHisSDB的发布填补了这一领域的空白,为研究人员提供了宝贵的资源,推动了胃癌自动化诊断算法的发展。
当前挑战
GasHisSDB数据集在构建过程中面临多项挑战。首先,胃癌组织病理学图像的获取和标注需要高度专业化的知识和技能,确保数据的准确性和可靠性。其次,数据集的多样性和代表性对于训练有效的分类模型至关重要,但实际操作中往往难以达到理想的平衡。此外,由于图像尺寸较大,处理和存储这些图像对计算资源提出了高要求。最后,如何有效地提取和利用图像特征,以提高分类器的性能,是该数据集面临的另一大挑战。
常用场景
经典使用场景
在胃癌的计算机辅助诊断领域,GasHisSDB数据集被广泛用于评估不同分类器的性能。该数据集包含245,196张胃癌病理图像,分为正常和异常两类。通过使用传统机器学习和深度学习方法,研究人员能够比较不同分类器在图像分类任务中的表现,从而推动胃癌早期检测技术的发展。
实际应用
在临床实践中,GasHisSDB数据集的应用主要体现在胃癌的早期诊断和治疗决策支持。通过训练和验证的分类器,医生可以快速、准确地识别胃癌病理图像中的异常区域,从而辅助病理学家进行诊断。此外,该数据集还可用于开发和测试新的图像分析工具,进一步提升胃癌诊断的自动化水平。
衍生相关工作
基于GasHisSDB数据集,研究人员开发了多种图像分类算法,包括传统机器学习方法和深度学习模型。例如,随机森林和支持向量机在传统机器学习方法中表现优异,而卷积神经网络(如VGG16和ResNet50)和基于Transformer的模型(如ViT)在深度学习领域取得了显著成果。这些研究不仅提升了胃癌图像分类的准确性,还为其他病理图像分析任务提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



