five

Monkeypox Skin Lesion Dataset (MSLD)

收藏
arXiv2025-04-24 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2504.17540v1
下载链接
链接失效反馈
官方服务:
资源简介:
猴痘皮肤病变数据集(MSLD)是一组包含猴痘、水痘和麻疹的皮肤病变图像的数据集,用于训练和评估模型。该数据集用于研究和开发一种基于深度学习的猴痘自动检测框架,旨在通过分析皮肤病变图像来提高早期诊断的准确性和效率。该框架采用Xception架构进行深度特征提取,并通过主成分分析(PCA)进行降维,以及自然梯度提升(NGBoost)算法进行分类。此外,还引入了非洲秃鹫优化算法(AVOA)来优化模型的性能和泛化能力。该框架提供了高精度和高效的诊断工具,有助于在资源有限的环境中早期检测和诊断猴痘。

The Monkeypox Skin Lesion Dataset (MSLD) is a curated collection of skin lesion images covering monkeypox, varicella (chickenpox), and measles, designed for model training and evaluation. This dataset supports the research and development of a deep learning-based automated monkeypox detection framework, which aims to improve the accuracy and efficiency of early diagnosis by analyzing skin lesion images. The framework adopts the Xception architecture for deep feature extraction, uses Principal Component Analysis (PCA) for dimensionality reduction, and leverages the Natural Gradient Boosting (NGBoost) algorithm for classification. Additionally, the African Vulture Optimization Algorithm (AVOA) is introduced to optimize the model's performance and generalization capability. This framework provides high-precision and efficient diagnostic tools, facilitating early detection and diagnosis of monkeypox in resource-constrained environments.
提供机构:
塞姆南大学电气与计算机工程系, 英国兰开斯特大学计算与通信学院
创建时间:
2025-04-24
搜集汇总
数据集介绍
main_image_url
构建方式
Monkeypox Skin Lesion Dataset (MSLD) 是一个公开可用的数据集,包含228张图像,其中102张为猴痘病例,126张为非猴痘病例(包括水痘和麻疹)。数据集通过多种网络爬取来源(如新闻门户、网站和公共病例报告)收集并分析生成。为了提高模型的泛化能力,数据集采用了多种数据增强技术,包括旋转、平移、反射、剪切、色调、饱和度、对比度和亮度抖动、噪声和缩放等。通过十四倍的数据增强,猴痘类别的图像数量增至1,428张,非猴痘类别增至1,764张。数据集按70:10:20的比例划分为训练集、测试集和验证集。
特点
MSLD数据集的特点在于其多样性和高质量。数据集涵盖了猴痘、水痘和麻疹的皮肤病变图像,分辨率统一为224×224×3。通过数据增强技术,数据集在保持原始图像特征的同时,显著增加了样本多样性,有助于模型学习更广泛的病变特征。此外,数据集的公开可用性为研究社区提供了宝贵的资源,支持了猴痘早期诊断的自动化研究。数据集还包含了详细的病例分布信息,便于研究者进行有针对性的分析和模型优化。
使用方法
MSLD数据集的使用方法包括数据预处理、特征提取和分类模型训练。在预处理阶段,图像被调整为285×285像素,并进行归一化处理。特征提取采用预训练的Xception模型,提取的2048维特征通过主成分分析(PCA)降维至530维。分类阶段使用自然梯度提升(NGBoost)算法,并通过非洲秃鹫优化算法(AVOA)进行超参数调优。模型的性能评估采用准确率、精确率、召回率、F1分数和AUC等指标。此外,数据集还可用于其他深度学习模型的训练和评估,如ResNet、Inception和MobileNet等。
背景与挑战
背景概述
Monkeypox Skin Lesion Dataset (MSLD) 是由伊朗塞姆南大学和英国兰卡斯特大学的研究团队于2022年开发的医学图像数据集,旨在解决猴痘病毒感染的早期诊断问题。该数据集包含228张原始图像(102例猴痘病例和126例非猴痘病例),通过14倍数据增强扩展至3192张图像,涵盖猴痘、水痘和麻疹的皮肤病变特征。作为首个公开的猴痘皮肤病变专项数据集,MSLD为深度学习模型提供了标准化评估基准,显著推动了AI在热带传染病诊断领域的研究进展。其核心价值在于通过计算机视觉技术弥补传统PCR检测在资源匮乏地区的应用局限,相关成果已发表于2023年的医学影像分析顶级期刊。
当前挑战
MSLD面临三重核心挑战:在领域问题层面,皮肤病变图像存在高度类间相似性(猴痘/水痘/麻疹的皮损形态相似度达62%),且早期病例样本稀缺导致数据分布偏差;在构建过程中,需解决医学图像标注的专业壁垒(需3名皮肤科医生交叉验证)和伦理审查问题(患者隐私保护);在技术实现上,小样本条件下的模型过拟合(原始数据仅228张)与数据增强带来的域偏移效应形成矛盾,需开发新型迁移学习框架。此外,病变区域的形态多样性(脓疱/丘疹/结痂的共存)要求模型具备多尺度特征捕捉能力,这对传统CNN架构提出了革新要求。
常用场景
衍生相关工作
围绕MSLD已衍生出多个标志性研究方向:Pramanik等人提出的Beta归一化集成框架实现了93.39%的准确率;Almufareh团队开发的非接触式计算机视觉方法在MobileNet上达到96.55%平衡准确度;Sitaula的多数投票集成策略将13种预训练模型性能提升至87.13%准确率。这些工作共同推动了皮肤病学AI诊断的三大技术演进——多模态特征融合、轻量化模型部署以及不确定性量化,为后续新发传染病的快速响应建立了方法论基础。
数据集最近研究
最新研究方向
近年来,Monkeypox Skin Lesion Dataset (MSLD) 在医学影像分析领域的研究方向主要集中在深度学习模型的优化与应用上。特别是在猴痘病毒(MPXV)的早期诊断中,研究者们通过结合迁移学习、特征提取和先进的机器学习技术,显著提升了诊断的准确性和效率。例如,最新的研究提出了一种基于Xception架构的深度特征提取方法,结合自然梯度提升(NGBoost)算法和非洲秃鹫优化算法(AVOA),在猴痘皮肤病变图像的分类中达到了97.53%的准确率。此外,研究还通过Grad-CAM和LIME技术增强了模型的可解释性,为临床决策提供了更透明的支持。这些进展不仅推动了猴痘诊断的自动化进程,也为资源有限地区的医疗实践提供了可行的解决方案。
相关研究论文
  • 1
    An Explainable Nature-Inspired Framework for Monkeypox Diagnosis: Xception Features Combined with NGBoost and African Vultures Optimization Algorithm塞姆南大学电气与计算机工程系, 英国兰开斯特大学计算与通信学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作