five

ISIC 2018 Task 1 & 2, Interactive Atlas of Dermoscopy

收藏
arXiv2020-04-24 更新2024-06-21 收录
下载链接:
https://github.com/alceubissoto/debiasing-skin
下载链接
链接失效反馈
官方服务:
资源简介:
本研究使用了两个广泛应用于皮肤病变分析的公共数据集:ISIC 2018 Task 1 & 2和Interactive Atlas of Dermoscopy。ISIC 2018 Task 1 & 2数据集包含2594张皮肤病理图像,用于病变分割和皮肤病理属性分割。Interactive Atlas of Dermoscopy是一个教育资源,用于训练皮肤科医生,包含872张皮肤病理图像。这些数据集用于分析和减少皮肤病变分类模型中的偏差,旨在提高模型在实际医疗决策中的可靠性和准确性。

This study utilized two public datasets widely adopted in skin lesion analysis: ISIC 2018 Task 1 & 2 and the Interactive Atlas of Dermoscopy. The ISIC 2018 Task 1 & 2 dataset consists of 2,594 dermatopathological images, which are used for lesion segmentation and dermatopathological attribute segmentation. The Interactive Atlas of Dermoscopy, an educational resource designed for training dermatologists, contains 872 dermatopathological images. These datasets are employed to analyze and mitigate biases in skin lesion classification models, with the aim of enhancing the reliability and accuracy of such models in real-world clinical decision-making.
提供机构:
计算研究所 (IC) 和电气与计算工程学院 (FEEC)
创建时间:
2020-04-24
搜集汇总
数据集介绍
main_image_url
构建方式
在皮肤病变分析领域,ISIC 2018 Task 1 & 2与Interactive Atlas of Dermoscopy数据集的构建体现了对医学图像质量的深度关注。该研究通过手动标注的方式,系统性地识别并记录了七种可能引入偏差的视觉伪影,包括暗角、毛发、凝胶边框、凝胶气泡、标尺、墨水标记及皮肤贴片。这些标注基于两个广泛使用的皮肤病变数据集,共计对3,466张图像进行了细致的人工审查,旨在揭示数据集中潜在的非临床相关性,为后续的模型去偏提供可靠的基础。
特点
该数据集的核心特点在于其针对皮肤病变图像中视觉伪影的系统性标注,这为研究机器学习模型中的偏差问题提供了独特视角。数据集不仅涵盖了常见的伪影类型,还通过量化这些伪影与病变标签之间的相关性,揭示了模型可能利用的微弱但累积的偏差源。此外,数据集的构建强调跨数据集验证,包括临床图像与皮肤镜图像的对比,从而增强了模型泛化能力的评估维度,为医学图像分析的可靠性研究提供了重要支撑。
使用方法
在应用该数据集时,研究者可将其用于评估和去除皮肤病变分类模型中的偏差。具体而言,数据集支持构建陷阱集,其中训练集与测试集的伪影-标签相关性被放大且方向相反,以检验模型对伪影的依赖程度。同时,结合去偏方法如LNTL,数据集可用于训练特征提取器与分类头,通过反向梯度更新来减少模型对伪影的学习。此外,数据集的标注信息还可用于分析模型特征相似性,帮助理解模型决策路径,从而推动更稳健的医学诊断系统开发。
背景与挑战
背景概述
在皮肤病变分析领域,ISIC 2018 Task 1 & 2与Interactive Atlas of Dermoscopy数据集作为关键资源,由国际皮肤影像协作组织(ISIC)及教育机构于近年联合构建,旨在推动自动化诊断模型的发展。这些数据集汇集了数千张皮肤镜图像,涵盖黑色素瘤、痣和脂溢性角化病等类别,并提供了病变分割与皮肤镜属性标注,为深度学习模型在医学图像分析中的训练与评估奠定了坚实基础。其创建不仅促进了皮肤癌早期检测技术的进步,还引发了学术界对数据偏差问题的深入探讨,成为研究模型鲁棒性与泛化能力的重要基准。
当前挑战
该数据集面临的挑战主要体现在两方面:其一,在解决皮肤病变分类问题时,模型易受数据中虚假相关性的干扰,例如图像背景中的暗角、毛发、凝胶边界等视觉伪影,可能导致网络依赖非临床特征进行决策,从而削弱其在真实医疗场景中的泛化能力。其二,在数据集构建过程中,采集图像的设备差异、标注不一致性以及类别不平衡等问题,加剧了偏差的引入,使得去偏方法如LNTL在当前技术下难以有效消除这些复杂纠缠的伪影影响,阻碍了可靠诊断系统的开发。
常用场景
经典使用场景
在皮肤病变分析领域,ISIC 2018 Task 1 & 2与Interactive Atlas of Dermoscopy数据集常被用于训练和评估深度学习模型,以自动识别恶性黑色素瘤、痣和脂溢性角化病等皮肤病变。这些数据集通过提供高质量的皮肤镜图像及其标注,支持模型在病变分割和属性识别任务中的性能优化,成为学术界验证算法鲁棒性与泛化能力的基础平台。
实际应用
在实际医疗场景中,该数据集支持开发自动化皮肤病变筛查系统,辅助皮肤科医生进行早期诊断。通过减少模型对图像伪影的依赖,提升系统在多样化和真实世界临床环境中的表现,从而降低误诊风险,增强医疗决策的可靠性与效率,推动人工智能在皮肤病学中的实际部署。
衍生相关工作
基于该数据集,多项经典研究得以衍生,包括Bissoto等人对偏见问题的深入探索,以及Kim等人提出的“学习不学习”偏见去除框架。这些工作进一步推动了皮肤病变分析中模型可解释性、跨数据集泛化测试以及合成数据生成等领域的发展,为医疗人工智能的稳健性研究奠定了重要基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作