five

Cervix93 Cytology Dataset

收藏
github2020-05-22 更新2024-05-31 收录
下载链接:
https://github.com/jiangyangbo/cytology_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含93个图像堆栈及其对应的扩展景深(EDF)图像,这些图像来自根据The Bethesda System分类为Negative、LSIL或HSIL的病例。数据集还包括每个帧的等级标签和手动标记的宫颈细胞内的点。

This dataset comprises 93 image stacks along with their corresponding Extended Depth of Field (EDF) images, derived from cases classified as Negative, LSIL, or HSIL according to The Bethesda System. The dataset also includes grade labels for each frame and manually annotated points within cervical cells.
创建时间:
2020-05-11
原始信息汇总

Cervix93 Cytology Dataset 概述

数据集描述

  • 图像数量与类型:包含93个图像堆栈及其对应的扩展景深(EDF)图像,来自不同等级的病例。

    • 负性(Negative): 16
    • 低度鳞状上皮内病变(LSIL): 46
    • 高度鳞状上皮内病变(HSIL): 31
  • 标注信息:每个图像帧的等级标签和宫颈细胞内手动标记的点。

    • 总手动标记点数:2705
    • 负性(Negative): 238
    • 低度鳞状上皮内病变(LSIL): 1536
    • 高度鳞状上皮内病变(HSIL): 931

训练与测试集划分

  • 训练集(Set 0)

    • 负性(Negative): 12帧, 179核
    • 低度鳞状上皮内病变(LSIL): 34帧, 1125核
    • 高度鳞状上皮内病变(HSIL): 23帧, 679核
  • 测试集(Set 1)

    • 负性(Negative): 4帧, 59核
    • 低度鳞状上皮内病变(LSIL): 12帧, 411核
    • 高度鳞状上皮内病变(HSIL): 8帧, 252核

代码资源

  • 代码文件夹:包含检测评估脚本(MATLAB)、基线分割方法及评估基线分割方法在测试数据集上的测试脚本。
搜集汇总
数据集介绍
main_image_url
构建方式
Cervix93细胞学数据集的构建基于93个图像堆栈及其对应的扩展景深(EDF)图像,这些图像来源于不同级别的宫颈细胞样本,包括阴性(Negative)、低度鳞状上皮内病变(LSIL)和高度鳞状上皮内病变(HSIL)。每个图像帧均标注了细胞内的手动标记点,总计2705个标记点,确保了数据的精确性和可靠性。数据集进一步划分为训练集和测试集,分别包含不同数量的帧和标记核,为模型训练和评估提供了坚实的基础。
特点
该数据集的特点在于其详尽的标注和多样化的样本分布。每个图像帧不仅标注了细胞病变的级别,还包含了细胞内的具体标记点,为细胞核的定位和识别提供了精确的参考。数据集的样本分布涵盖了不同病变程度的细胞,确保了模型在不同病理条件下的泛化能力。此外,数据集的划分方式合理,训练集和测试集的样本数量和标记核分布均衡,便于进行有效的模型训练和性能评估。
使用方法
使用Cervix93细胞学数据集时,研究人员可以通过提供的MATLAB脚本进行细胞核检测和分割的评估。数据集中的训练集可用于模型的训练和优化,而测试集则用于评估模型的性能。基线分割方法和测试脚本为研究人员提供了一个起点,便于在此基础上进行进一步的算法改进和实验验证。通过参考相关论文,用户可以更深入地理解数据集的构建方法和应用场景,从而更好地利用该数据集进行宫颈细胞病变的研究。
背景与挑战
背景概述
Cervix93 Cytology Dataset 是一个专注于宫颈细胞学分析的图像数据集,创建于2018年,由相关领域的研究人员基于《贝塞斯达系统》分类标准构建。该数据集包含93组图像堆栈及其对应的扩展景深(EDF)图像,涵盖了阴性(Negative)、低度鳞状上皮内病变(LSIL)和高度鳞状上皮内病变(HSIL)三类样本。数据集的核心研究问题在于通过自动化方法对宫颈细胞进行精确分类和病变检测,以辅助病理学家提高诊断效率和准确性。该数据集为宫颈癌早期筛查和细胞病理学研究提供了重要的数据支持,推动了计算机视觉与医学影像分析的交叉领域发展。
当前挑战
Cervix93 Cytology Dataset 面临的挑战主要集中在两个方面。其一,宫颈细胞图像的复杂性和多样性使得自动化分类和病变检测任务极具挑战性,尤其是低度与高度病变之间的细微差异难以区分。其二,数据集的构建过程中,手动标注宫颈细胞核内的关键点需要高度专业知识和大量时间投入,标注的一致性和准确性直接影响模型的训练效果。此外,数据集的样本量相对有限,可能限制了深度学习模型的泛化能力。这些挑战不仅反映了宫颈细胞学分析的复杂性,也为未来研究提供了改进方向。
常用场景
经典使用场景
Cervix93 Cytology Dataset在宫颈细胞学研究中具有重要应用,特别是在宫颈癌早期筛查和诊断领域。该数据集通过提供93个图像堆栈及其对应的扩展深度场(EDF)图像,涵盖了阴性、低度鳞状上皮内病变(LSIL)和高度鳞状上皮内病变(HSIL)三种不同级别的细胞学样本。研究人员可以利用这些图像进行细胞核的自动检测和分割,从而评估不同算法的性能。
衍生相关工作
基于Cervix93 Cytology Dataset,许多经典的研究工作得以展开。例如,研究人员开发了多种基于深度学习的细胞核检测和分割算法,这些算法在宫颈癌早期筛查中表现出色。此外,该数据集还促进了宫颈细胞学图像分析领域的标准化,推动了相关技术的进一步发展。
数据集最近研究
最新研究方向
在宫颈细胞学领域,Cervix93 Cytology Dataset的引入为自动化宫颈癌筛查技术的发展提供了重要支持。该数据集包含93个图像堆栈及其对应的扩展深度场(EDF)图像,涵盖了阴性、低度鳞状上皮内病变(LSIL)和高度鳞状上皮内病变(HSIL)三种病理分级。近年来,基于该数据集的研究主要集中在深度学习模型的优化与应用上,特别是在细胞核检测与分割任务中,研究者们通过改进卷积神经网络(CNN)和生成对抗网络(GAN)等算法,显著提升了宫颈细胞病理图像的自动化分析精度。此外,该数据集还被用于探索多模态数据融合技术,结合EDF图像与细胞核标记点信息,进一步提高了病变检测的敏感性和特异性。这些研究不仅推动了宫颈癌早期筛查的智能化进程,也为其他医学影像分析领域提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作