DFU数据集
收藏arXiv2020-02-09 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1908.05317v4
下载链接
链接失效反馈官方服务:
资源简介:
DFU数据集是由曼彻斯特都会大学和兰开夏教学医院合作创建,包含1459张糖尿病足溃疡患者的足部图像。该数据集首次引入了缺血和感染情况的真实标签,用于研究目的。数据集的创建旨在通过计算机视觉技术识别糖尿病足溃疡中的缺血和感染,以预测截肢风险。数据集的图像通过不同相机(如Kodak DX4530, Nikon D3300, 和Nikon COOLPIX P100)拍摄,覆盖了过去五年内的病例。该数据集的应用领域主要集中在通过机器学习算法提高糖尿病足溃疡的诊断准确性,减少医疗成本和提高患者生存率。
The DFU (Diabetic Foot Ulcer) dataset was jointly developed by Manchester Metropolitan University and Lancashire Teaching Hospitals, containing 1459 foot images of patients with diabetic foot ulcers. This is the first dataset to provide ground truth labels for ischemia and infection conditions, specifically intended for research purposes. The dataset was created to identify ischemia and infection in diabetic foot ulcers through computer vision technologies, so as to predict the risk of amputation. The images in the dataset were captured using various camera models including Kodak DX4530, Nikon D3300 and Nikon COOLPIX P100, covering clinical cases from the past five years. The main application fields of this dataset focus on improving the diagnostic accuracy of diabetic foot ulcers, reducing medical costs and enhancing patient survival rates via machine learning algorithms.
提供机构:
曼彻斯特都会大学高级计算科学中心
创建时间:
2019-08-15
搜集汇总
数据集介绍

构建方式
在糖尿病足溃疡(DFU)的计算机辅助诊断领域,构建高质量数据集是推动算法研究的关键。DFU数据集通过收集兰开夏教学医院五年间的1459张患者足部图像建立,所有图像均获得伦理委员会批准及患者知情同意。数据采集使用了多种相机设备(如Kodak DX4530、Nikon D3300等),以确保来源的多样性。数据标注由两位糖尿病足专科医生独立完成,通过视觉检查对缺血和感染情况进行二元标注,存在分歧时由资深医生仲裁,从而形成可靠的基准真值标签。该过程首次为DFU的缺血与感染识别提供了公开可用的标注数据,为后续机器学习研究奠定了坚实基础。
特点
DFU数据集在医学影像分析中展现出若干鲜明特点。其核心价值在于首次针对糖尿病足溃疡中的缺血与感染状况提供了专家标注的基准真值,涵盖了缺血与非缺血、感染与非感染的二元分类标签。数据集的图像分辨率较高,尺寸介于1600×1200至3648×2736之间,且来源设备多样,反映了临床实践中图像采集的异质性。值得注意的是,数据分布存在不平衡现象:缺血案例中非缺血样本(1249例)显著多于缺血样本(210例),而感染与非感染样本则相对均衡(分别为831例和628例)。此外,数据集中足溃疡区域占整个足部图像面积较小(约92%案例中占比低于20%),这为模型聚焦关键区域带来了挑战,也凸显了数据增强策略的必要性。
使用方法
该数据集主要用于开发与评估糖尿病足溃疡缺血与感染的自动识别算法。研究人员可基于其二元标注开展分类任务,采用传统机器学习或深度学习模型进行训练与验证。实践中,由于溃疡区域占比小,建议先使用目标检测算法(如Faster R-CNN)定位感兴趣区域,再通过自然数据增强技术——包括基于溃疡区域的放大以及旋转、镜像、噪声添加等变换——来扩充数据并提升模型鲁棒性。数据集可按70%/10%/20%的比例划分为训练、验证与测试集,并采用五折交叉验证以稳定评估性能。在算法层面,既可尝试论文提出的超像素颜色描述符等手工特征结合传统分类器(如随机森林、多层感知机),也可利用预训练的卷积神经网络(如Inception-V3、ResNet50)进行微调或集成学习,以比较不同方法在准确率、灵敏度、特异性等指标上的表现。
背景与挑战
背景概述
糖尿病足溃疡(DFU)作为糖尿病的主要并发症,其早期识别与精准评估对降低截肢风险至关重要。由曼彻斯特城市大学、兰开夏教学医院及中山大学孙逸仙纪念医院等机构的研究团队于2020年联合构建的DFU数据集,首次针对缺血与感染两种关键病理状态提供了标注数据。该数据集包含1459张足部图像,旨在通过计算机视觉与机器学习技术,辅助临床医生从图像中自动识别缺血(血液供应不足)与感染(细菌侵入)迹象,从而推动远程医疗监测系统的发展。其核心研究问题聚焦于突破传统DFU分类系统(如SINBAD)中依赖主观视觉评估的局限,为智能化溃疡分析奠定数据基础,对糖尿病足管理领域的精准医疗实践具有深远影响。
当前挑战
DFU数据集所应对的领域挑战在于从非标准化足部图像中准确识别缺血与感染,这两类病理状态在视觉上常呈现细微差异,且易受光照、皮肤色调等因素干扰,导致高类内差异与类间相似性。构建过程中的挑战包括:数据收集需协调多机构伦理审批与患者知情同意,标注依赖专科医生视觉评估而缺乏血液检测等客观金标准支持;图像来源异构(使用多种相机拍摄),存在拍摄距离、角度与光照条件不统一问题;数据集存在类别不平衡(如缺血案例较少),且溃疡区域在图像中占比微小,需设计自然数据增强等专门技术以聚焦病灶特征。
常用场景
经典使用场景
在糖尿病足溃疡的计算机辅助诊断领域,DFU数据集为缺血与感染的视觉识别提供了关键基准。该数据集通过专家标注的足部图像,支持机器学习模型进行二分类任务,即区分缺血与非缺血、感染与非感染状态。其经典应用场景在于训练卷积神经网络等深度学习架构,实现端到端的病理特征提取与分类,为自动化溃疡评估系统奠定数据基础。
实际应用
该数据集的实际应用聚焦于临床辅助诊断与远程健康监测系统。通过集成至移动医疗平台,训练后的模型可协助基层医疗人员快速筛查足部溃疡的缺血与感染风险,尤其在资源匮乏地区弥补专科医师的短缺。此外,该系统能实现溃疡进展的纵向跟踪,为个性化治疗方案的制定提供可视化依据,从而降低截肢率并优化医疗资源分配。
衍生相关工作
DFU数据集催生了多项糖尿病足溃疡分析的前沿研究。基于该数据,学者们开发了超像素颜色描述符等手工特征提取方法,以及集成卷积神经网络等深度学习框架。后续工作进一步扩展至溃疡分割、三维建模与多模态数据融合,并促进了SINBAD等临床分类系统与人工智能技术的结合,形成了从病理检测到预后评估的完整研究链条。
以上内容由遇见数据集搜集并总结生成



