five

Skin Cancer MNIST HAM10000

收藏
github2022-12-08 更新2024-05-31 收录
下载链接:
https://github.com/arthursoenarto/csc490project
下载链接
链接失效反馈
官方服务:
资源简介:
HAM10000数据集是一个包含多种来源的常见色素性皮肤病变的皮肤镜图像的大型集合。它也是国际皮肤影像合作组织(ISIC)2018挑战的数据集。

The HAM10000 dataset is a comprehensive collection of dermoscopic images featuring a variety of common pigmented skin lesions from multiple sources. It also served as the dataset for the International Skin Imaging Collaboration (ISIC) 2018 Challenge.
创建时间:
2022-10-01
原始信息汇总

数据集概述

数据集名称

  • Skin Cancer MNIST HAM10000
  • 2018 ISIC Challenge

数据集描述

  • HAM10000: 包含多源皮肤镜图像的大型集合,用于常见的色素性皮肤病变。该数据集也是国际皮肤影像合作组织(ISIC)2018挑战赛的数据集。
  • 2018 ISIC Challenge: 提供皮肤病变图像及其相关属性,用于机器学习模型的训练和评估。

数据集用途

该数据集主要用于训练和评估机器学习模型,以解决2018 ISIC挑战赛的三个任务:

  1. 病变分割
  2. 病变属性检测
  3. 疾病分类

数据集结构

  • HAM10000: 图像格式为JPEG,文件命名遵循ISIC_<image_id>.jpg模式。
  • 2018 ISIC Challenge: 图像格式为JPEG,文件命名遵循ISIC_<image_id>.jpg模式,响应数据为PNG格式的二值掩码图像,命名遵循ISIC_<image_id>_segmentation.png模式。

数据集处理

  • 使用UNet、DoubleUNet和TripleUNet等卷积网络架构进行图像分割和属性检测。
  • 通过特征提取和模型训练,实现疾病分类。

数据集评估指标

  • UNet: 准确率0.8691,Dice分数0.7385,IOU 0.6189。
  • DoubleUNet: 准确率0.8590,Dice分数0.7194,IOU 0.6020。
  • TripleUNet: 准确率0.8712,Dice分数0.7433,IOU 0.6317。

数据集应用

  • 用于训练和测试皮肤病变分割、属性检测和疾病分类的机器学习模型。
  • 通过不同的网络架构和训练策略,提高模型的准确性和泛化能力。

数据集挑战

  • 数据集存在不平衡问题,部分属性在图像中的出现频率较低,影响模型的训练效果。
  • 需要进一步优化模型和训练策略,以提高分类任务的准确性。
搜集汇总
数据集介绍
main_image_url
构建方式
Skin Cancer MNIST HAM10000数据集的构建基于多源皮肤镜图像,涵盖了常见的色素性皮肤病变。该数据集由国际皮肤影像协作组织(ISIC)2018挑战赛提供,包含10,000张皮肤病变图像,每张图像均配有相应的二进制掩码,用于标识病变区域。图像经过预处理,包括尺寸调整至90x90像素,并进行归一化处理,将像素值从0-255映射到0-1之间。数据集的构建旨在为皮肤癌的自动诊断提供高质量的图像数据支持。
特点
该数据集的特点在于其多样性和高质量。图像来源于多个不同的皮肤镜设备,涵盖了七种常见的皮肤病变类型,包括黑色素瘤、基底细胞癌等。每张图像均配有精确的病变区域掩码,便于进行病变分割任务。此外,数据集还提供了病变属性的二进制掩码,如色素网络、条纹等,进一步丰富了数据的应用场景。数据集的多样性和标注的精确性使其成为皮肤癌诊断研究的重要资源。
使用方法
使用该数据集时,首先需通过虚拟环境安装所需的Python库,并加载数据集。对于病变分割任务,可以使用UNet、DoubleUNet或TripleUNet等卷积神经网络模型进行训练和测试。对于病变属性检测任务,同样可以采用UNet模型进行训练。在分类任务中,可以通过提取病变区域的掩码,并将其与原始图像叠加,作为分类模型的输入。常用的分类模型包括ResNet和Capsule Network,用户可以根据需求选择不同的模型进行训练和评估。
背景与挑战
背景概述
Skin Cancer MNIST HAM10000数据集是由国际皮肤影像协作组织(ISIC)于2018年发布的一个重要医学影像数据集,旨在推动皮肤癌的早期检测与诊断研究。该数据集包含了超过10,000张多源皮肤镜图像,涵盖了七种常见的色素性皮肤病变类型,包括黑色素瘤、基底细胞癌等。该数据集的创建背景源于皮肤癌在北美地区的高发病率,尤其是由于紫外线过度暴露导致的皮肤病变。通过提供高质量的皮肤镜图像及其对应的病变标签,HAM10000数据集为研究人员开发基于机器学习的皮肤癌诊断工具提供了坚实的基础,极大地促进了医学影像分析领域的发展。
当前挑战
Skin Cancer MNIST HAM10000数据集在应用过程中面临多重挑战。首先,皮肤病变的多样性和复杂性使得图像分类任务极具挑战性,尤其是不同病变类型之间的视觉相似性较高,容易导致误判。其次,数据集中存在类别不平衡问题,某些病变类型的样本数量较少,可能影响模型的泛化能力。此外,数据集的构建过程中,皮肤镜图像的采集和标注需要高度专业的医学知识,确保标签的准确性和一致性是一项艰巨的任务。最后,尽管数据集提供了丰富的图像信息,但如何有效提取病变特征并设计鲁棒的分类模型仍然是研究人员需要解决的核心问题。
常用场景
经典使用场景
Skin Cancer MNIST HAM10000数据集在医学影像分析领域具有广泛的应用,尤其是在皮肤癌的自动诊断和分类任务中。该数据集包含了大量多源皮肤镜图像,涵盖了常见的色素性皮肤病变,为研究人员提供了一个标准化的基准数据集。通过该数据集,研究人员可以训练和验证深度学习模型,以实现对皮肤病变的精确分割、属性检测和疾病分类。
衍生相关工作
基于Skin Cancer MNIST HAM10000数据集,许多经典的研究工作得以展开。例如,研究人员开发了多种深度学习模型,如U-Net、DoubleU-Net和TripleU-Net,用于病变分割任务。此外,该数据集还催生了多种分类模型,如ResNet和Capsule Networks,这些模型在皮肤病变分类任务中表现出色,推动了医学影像分析技术的进步。
数据集最近研究
最新研究方向
在皮肤癌诊断领域,HAM10000数据集作为国际皮肤影像协作组织(ISIC)2018挑战赛的核心数据集,近年来在医学影像分析中占据了重要地位。该数据集包含大量多源皮肤镜图像,涵盖了常见的色素性皮肤病变,为深度学习模型提供了丰富的训练素材。当前研究热点主要集中在病变分割、病变属性检测和疾病分类三大任务上。其中,病变分割通过U-Net及其变体(如DoubleU-Net和TripleU-Net)实现了高精度的像素级分类,而疾病分类则通过ResNet和胶囊网络(如FixCaps)等模型提升了诊断准确性。特别是胶囊网络的应用,通过动态路由机制弥补了传统卷积神经网络的不足,进一步提高了分类性能。这些研究不仅推动了皮肤癌早期诊断技术的发展,也为其他医学影像分析任务提供了重要的参考和借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作