five

MHSMA

收藏
github2024-03-23 更新2024-05-31 收录
下载链接:
https://github.com/soroushj/mhsma-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MHSMA数据集是一个包含235名男性不育患者精子图像的集合。每个图像由专家标注,用于区分精子的顶体、头部、空泡和尾部的正常或异常状态。数据集包括训练、验证和测试集,分别包含1000、240和300张图像。图像提供128x128像素和64x64像素两种尺寸。

The MHSMA dataset is a collection of sperm images from 235 male infertility patients. Each image is annotated by experts to distinguish between normal and abnormal states of the sperm's acrosome, head, vacuole, and tail. The dataset includes training, validation, and test sets, containing 1000, 240, and 300 images respectively. The images are provided in two sizes: 128x128 pixels and 64x64 pixels.
创建时间:
2019-05-02
原始信息汇总

数据集概述

数据集名称

  • MHSMA: The Modified Human Sperm Morphology Analysis Dataset

数据集描述

  • 来源:该数据集包含来自235名男性不育患者的精子图像。
  • 内容:每个图像由专家标注,区分精子的顶体、头部、空泡和尾部的正常或异常状态。
  • 图像规格:图像提供两种不同的裁剪尺寸,即128x128像素和64x64像素。
  • 标签类型:标签为二元分类,0表示正常(阳性),1表示异常(阴性)。

数据集结构

  • 分割:数据集分为训练集、验证集和测试集,分别包含1000、240和300张图像。
  • 文件格式:数据以.npy格式存储,可通过numpy.load加载。
  • 文件详情
    • 训练集
      • x_128_train.npy:1000张,128x128像素,uint8类型
      • x_64_train.npy:1000张,64x64像素,uint8类型
    • 验证集
      • x_128_valid.npy:240张,128x128像素,uint8类型
      • x_64_valid.npy:240张,64x64像素,uint8类型
    • 测试集
      • x_128_test.npy:300张,128x128像素,uint8类型
      • x_64_test.npy:300张,64x64像素,uint8类型
    • 标签文件
      • 分别针对顶体、头部、空泡和尾部,每个分割有对应的标签文件,如y_acrosome_train.npyy_head_train.npy等。

数据集统计

  • 全数据集
    • 顶体:1086个阳性,454个阴性,阳性率70.52%
    • 头部:1122个阳性,418个阴性,阳性率72.86%
    • 空泡:1301个阳性,239个阴性,阳性率84.48%
    • 尾部:1471个阳性,69个阴性,阳性率95.52%
  • 训练集
    • 顶体:699个阳性,301个阴性,阳性率69.90%
    • 头部:727个阳性,273个阴性,阳性率72.70%
    • 空泡:830个阳性,170个阴性,阳性率83.00%
    • 尾部:954个阳性,46个阴性,阳性率95.40%
  • 验证集
    • 顶体:174个阳性,66个阴性,阳性率72.50%
    • 头部:176个阳性,64个阴性,阳性率73.33%
    • 空泡:209个阳性,31个阴性,阳性率87.08%
    • 尾部:233个阳性,7个阴性,阳性率97.08%
  • 测试集
    • 顶体:213个阳性,87个阴性,阳性率71.00%
    • 头部:219个阳性,81个阴性,阳性率73.00%
    • 空泡:262个阳性,38个阴性,阳性率87.33%
    • 尾部:284个阳性,16个阴性,阳性率94.67%

结果

  • 方法
    • 2019年4月:一种新的深度学习方法,针对顶体、头部和空泡的评估。
    • 2020年11月:深度迁移学习和多任务学习对精子异常检测的影响。
  • 性能指标:包括准确率、精确率、召回率、F0.5分数、G-mean、ROC AUC和MCC。
搜集汇总
数据集介绍
main_image_url
构建方式
MHSMA数据集的构建基于235名男性不育症患者的精子图像,每张图像均由专家标注了精子顶体、头部、空泡和尾部的正常或异常状态。数据集分为训练集、验证集和测试集,分别包含1000、240和300张图像。图像以两种裁剪尺寸提供,分别为128x128像素和64x64像素,且均为灰度图像,精子头部大致位于图像中心,尾部未完全显示。数据以`.npy`格式存储,便于使用NumPy库加载。
特点
MHSMA数据集的特点在于其专注于精子形态的精细分析,涵盖了顶体、头部、空泡和尾部四个关键部位的标注。数据集中的图像均为灰度图,且精子头部位于图像中心,尾部未完全显示,这为研究精子形态提供了标准化的视觉数据。此外,数据集提供了两种不同尺寸的图像裁剪版本,便于不同分辨率下的研究需求。数据集的标签为二分类,分别表示正常(0)和异常(1),且各类标签的分布较为均衡,适合用于分类模型的训练与评估。
使用方法
MHSMA数据集的使用方法较为简便,用户可通过NumPy库加载`.npy`格式的数据文件。数据集已预先划分为训练集、验证集和测试集,用户可直接用于模型训练、验证和测试。每张图像对应四个标签,分别表示精子顶体、头部、空泡和尾部的状态,用户可根据研究需求选择特定标签进行模型训练。此外,数据集提供了两种图像尺寸版本,用户可根据计算资源或研究目标选择合适的尺寸。使用该数据集时,建议遵循CC BY-NC-SA 4.0许可协议,并在研究中引用相关文献以支持学术规范。
背景与挑战
背景概述
MHSMA(Modified Human Sperm Morphology Analysis)数据集是一个专注于人类精子形态分析的医学影像数据集,旨在辅助男性不育症的诊断与研究。该数据集由235名男性不育症患者的精子图像构成,每张图像均由专家标注了精子顶体、头部、空泡和尾部的正常或异常状态。MHSMA数据集于2019年由Soroush Javadi和Seyed Abolghasem Mirroshandel等人创建,基于Ghasemian等人于2015年提出的HSMA-DS数据集进行改进。该数据集的发布为精子形态自动分析提供了重要的数据支持,推动了深度学习技术在生殖医学领域的应用。
当前挑战
MHSMA数据集在解决精子形态自动分析问题时面临多重挑战。首先,精子图像的形态特征复杂且细微,尤其是顶体和空泡的异常检测对模型的精度要求极高。其次,数据集中不同类别的样本分布不均衡,例如尾部异常样本占比极低,可能导致模型在少数类上的性能下降。在构建过程中,专家标注的一致性和准确性是关键挑战,由于精子形态的主观判断差异,标注过程需要严格的标准化和验证。此外,图像的分辨率和裁剪方式也可能影响模型的训练效果,如何在有限的分辨率下保留关键形态信息是技术上的难点。
常用场景
经典使用场景
MHSMA数据集在生殖医学和计算机视觉领域具有重要应用,尤其在男性不育症的研究中,该数据集被广泛用于训练和评估深度学习模型,以自动分析人类精子的形态特征。通过提供大量标注的精子图像,研究人员能够开发出高效的算法,用于识别精子的顶体、头部、空泡和尾部等关键部位的异常情况。
解决学术问题
MHSMA数据集解决了传统精子形态分析中依赖人工观察的主观性和低效性问题。通过提供标准化的图像数据和专家标注,该数据集为开发自动化精子形态分析算法提供了可靠的基础。这不仅提高了分析的准确性和一致性,还为研究精子形态与男性不育症之间的关系提供了新的工具。
衍生相关工作
MHSMA数据集催生了一系列经典研究工作,例如基于深度学习的精子形态自动评估方法。相关研究不仅验证了深度学习在精子形态分析中的有效性,还探索了多任务学习和深度迁移学习等先进技术在该领域的应用。这些工作进一步推动了生殖医学与人工智能的交叉研究,为未来的创新奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作