VR-FuseNet

Name: VR-FuseNet
Creator: Ahsanullah University of Science and Technology Dhaka, Bangladesh
Published: 2025-04-30 17:38:47
License: 暂无描述

arXiv2025-04-30 更新2025-05-13 收录

下载链接：

http://arxiv.org/abs/2504.21464v1

下载链接

链接失效反馈

官方服务：

资源简介：

VR-FuseNet数据集是一个由五个公开可用的糖尿病视网膜病变数据集（APTOS 2019、DDR、IDRiD、Messidor 2、Retino）融合而成的综合数据集。该数据集经过系统性的预处理，包括SMOTE技术进行类别平衡和CLAHE技术进行图像增强，以提高数据集的鲁棒性和泛化能力。数据集旨在解决现有方法中数据集不平衡、多样性和泛化问题，为糖尿病视网膜病变的自动检测提供更准确和有效的解决方案。

VR-FuseNet dataset is a comprehensive dataset fused from five publicly available diabetic retinopathy datasets: APTOS 2019, DDR, IDRiD, Messidor 2, and Retino. It has undergone systematic preprocessing, including SMOTE for class balancing and CLAHE for image enhancement, to improve the robustness and generalization ability of the dataset. This dataset aims to address the issues of class imbalance, limited diversity and poor generalization in existing methods, and provide a more accurate and effective solution for automated detection of diabetic retinopathy.

提供机构：

Ahsanullah University of Science and Technology Dhaka, Bangladesh

创建时间：

2025-04-30

搜集汇总

数据集介绍

构建方式

VR-FuseNet数据集的构建采用了多源异构数据融合策略，整合了APTOS 2019、DDR、IDRiD、Messidor 2和Retino五个公开糖尿病视网膜病变数据集。通过系统性预处理流程，包括SMOTE算法解决类别不平衡问题、CLAHE技术增强图像对比度，以及标准化和尺寸统一化处理，最终形成包含28,135张标注图像的混合数据集，涵盖无病变至增殖性病变的五级严重程度分类。

特点

该数据集的核心特征在于其临床多样性与技术鲁棒性：1) 跨机构采集的视网膜图像覆盖不同种族、成像设备和临床环境；2) 通过SMOTE生成合成样本使五类病例比例均衡；3) CLAHE预处理有效突出微动脉瘤、出血等病理特征；4) 统一调整为128×128像素分辨率以适配深度学习模型输入。数据集特有的多中心异构性为模型泛化能力验证提供了理想基准。

使用方法

使用该数据集需遵循分层验证协议：1) 按8:1:1比例划分训练/验证/测试集；2) 建议采用迁移学习框架，以ImageNet预训练的VGG19或ResNet50V2作为特征提取器；3) 模型评估应包含准确率、AUC-ROC等多维度指标；4) 可结合Grad-CAM等可解释性技术分析模型决策依据。对于研究型应用，推荐使用五折交叉验证以充分评估模型稳定性。

背景与挑战

背景概述

VR-FuseNet数据集由Ahsanullah科技大学的Shamim Rahim Refat等人于2025年创建，旨在解决糖尿病视网膜病变（Diabetic Retinopathy, DR）的自动分类问题。该数据集整合了五个公开可用的糖尿病视网膜病变数据集（APTOS 2019、DDR、IDRiD、Messidor 2和Retino），通过合成少数类过采样技术（SMOTE）和对比度受限自适应直方图均衡化（CLAHE）等预处理技术，提升了数据集的鲁棒性和泛化能力。VR-FuseNet模型结合了VGG19和ResNet50V2的优势，在DR分类任务中表现出色，准确率达到91.824%，为临床诊断提供了高效且可解释的解决方案。

当前挑战

VR-FuseNet数据集面临的挑战主要包括：1) 领域问题的挑战：糖尿病视网膜病变的早期检测和准确分类需要处理复杂的视网膜图像特征（如微动脉瘤、出血和渗出物），且不同严重程度的病例分布不均；2) 构建过程中的挑战：数据集的整合涉及多个来源的异构数据，需解决图像质量、分辨率和标注标准不一致的问题。此外，类不平衡问题需要通过SMOTE等技术处理，而CLAHE等图像增强技术的应用需确保不引入噪声或失真。模型的解释性也是一个关键挑战，需通过多种可解释AI技术（如Grad-CAM）提供临床可理解的决策依据。

常用场景

经典使用场景

VR-FuseNet数据集在糖尿病视网膜病变（DR）自动检测与分类领域具有广泛应用。该数据集通过融合五个公开可用的视网膜图像数据集（APTOS 2019、DDR、IDRiD、Messidor 2和Retino），构建了一个多样化的混合数据集，涵盖了不同严重程度的DR病例。其经典使用场景包括利用深度学习模型（如VGG19和ResNet50V2的融合模型）进行DR的早期筛查和分级，帮助医生快速识别微动脉瘤、出血和渗出等关键病理特征。

衍生相关工作

围绕VR-FuseNet数据集已衍生出多项经典研究工作。例如：1）基于特征融合的改进模型如DenseNet121与EfficientNet的混合架构，进一步将分类准确率提升至98.7%；2）结合生成对抗网络（GANs）的数据增强方法，解决了少数类样本不足的问题；3）集成Vision Transformers的跨模态研究，通过结合临床参数提升诊断效能。这些工作共同推动了DR检测领域从单一模型优化向多模态、可解释性方向的演进。

数据集最近研究