OCTDL
收藏arXiv2025-11-06 更新2025-11-08 收录
下载链接:
http://www.octdl.org/
下载链接
链接失效反馈官方服务:
资源简介:
OCTDL数据集是一个包含2064张高分辨率光学相干断层扫描(OCT)图像的公开数据集,这些图像代表了七种不同的视网膜疾病,并存在显著的类别不平衡。该数据集由医学专家进行标注,确保了诊断的可靠性,并在眼科学相关的深度学习研究中得到了广泛应用。论文中提出了基于类别的输入图像组合方法(CB-ImgComp),通过将多个同类别图像融合成单个图像,增强了数据集的信息密度和类内变化性,提高了模型对细微疾病模式的区分能力。
The OCTDL dataset is a public dataset containing 2064 high-resolution optical coherence tomography (OCT) images that correspond to seven distinct retinal diseases and exhibit significant class imbalance. Annotated by medical experts to ensure diagnostic reliability, this dataset has been widely applied in deep learning research related to ophthalmology. A class-based input image combination method (CB-ImgComp) was proposed in the associated paper, which fuses multiple images of the same class into a single image to enhance the information density and intra-class variability of the dataset, thereby improving the model's ability to distinguish subtle disease patterns.
提供机构:
摩洛哥费斯市塔扎市多学科工程科学实验室,塔扎市,西迪·穆罕默德·本·阿卜杜拉大学(USMBA)
创建时间:
2025-11-06
搜集汇总
数据集介绍
构建方式
在眼科影像分析领域,数据稀缺与类别失衡是制约深度学习模型性能的关键因素。OCTDL数据集的构建基于高分辨率光学相干断层扫描技术,原始包含2,064张视网膜影像,涵盖七种疾病类别。为克服样本不平衡与特征模糊性,研究团队开发了基于类别的图像合成技术,通过定义组合维度(如3×1布局)、采用无重复样本选择策略,将同类多张影像融合为单一复合样本,并辅以轻微旋转增强空间多样性,最终生成类别均衡的合成数据集Co-OCTDL。
特点
该数据集的核心特征体现在其结构性增强与病理表征优化。复合图像通过聚合同类样本的视觉特征,显著提升了单一样本的信息密度与类内差异性,使模型能够捕捉更细微的疾病模式。数据集实现了完美的类别平衡,每个疾病类别均包含1,540个复合样本,有效消除了原始数据中少数类样本不足的局限。同时,复合生成过程通过控制图像组合的相似度差异,既保留了语义一致性,又降低了跨类别视觉混淆风险,为模型提供了更具判别力的训练基础。
使用方法
在医学影像诊断研究中,该数据集适用于深度神经网络训练与验证流程。使用者可直接将复合图像作为模型输入,采用标准卷积神经网络(如VGG16)进行端到端训练。为确保评估可靠性,建议采用五折交叉验证策略,固定超参数配置以隔离数据表征的影响。数据集支持疾病分类、特征可视化等任务,其平衡特性使得模型无需依赖代价敏感学习即可实现稳定性能,特别适用于小样本场景下的泛化能力验证与临床诊断辅助系统开发。
背景与挑战
背景概述
光学相干断层扫描(OCT)作为非侵入性视网膜成像技术,在眼科疾病诊断中具有重要价值。OCTDL数据集由Kulyabin等人于2024年创建,包含2,064张高分辨率视网膜OCT图像,涵盖年龄相关性黄斑变性、糖尿病黄斑水肿等七类疾病。该数据集专为基于深度学习的医学图像分析设计,旨在解决视网膜病理形态相似性高导致的诊断困难,已成为评估眼科人工智能模型性能的重要基准。
当前挑战
OCTDL数据集面临的核心挑战在于视网膜疾病间的高度视觉相似性,如年龄相关性黄斑变性与糖尿病视网膜病变的形态特征重叠,导致模型区分困难。构建过程中需应对严重的类别不平衡问题,某些疾病类别样本量不足整体数据集的1%,同时高分辨率OCT图像的特征提取需要克服噪声干扰和病变区域定位精度等技术难题。
常用场景
经典使用场景
在眼科医学影像分析领域,OCTDL数据集作为高分辨率视网膜光学相干断层扫描图像的标准化基准,其经典应用场景聚焦于深度学习模型对七类视网膜疾病的分类任务。该数据集通过提供经过医学专家标注的2064张扫描图像,为研究者构建疾病自动诊断系统提供了关键数据支撑,尤其在处理年龄相关性黄斑变性、糖尿病黄斑水肿等具有高视觉相似性的病理特征时展现出独特价值。
实际应用
在临床实践中,OCTDL衍生的诊断模型可辅助眼科医生进行快速精准的病理筛查。其复合图像生成策略通过增强单样本信息密度,大幅降低了假阳性与假阴性风险,这种特性使其特别适合部署在医疗资源匮乏地区的远程诊断系统中。该技术已证明能有效区分糖尿病视网膜病变与视网膜静脉阻塞等易混淆病症,为临床决策提供可靠依据。
衍生相关工作
基于OCTDL的创新方法论催生了系列重要研究,包括将复合图像生成与Transformer架构结合的跨模态学习框架,以及融合注意力机制的病变区域定位系统。这些工作通过结合语义一致性保持与特征增强策略,进一步发展了针对医学影像的数据扩增理论,其中基于少数类驱动的平衡算法已成为处理医疗数据不平衡问题的典型范例。
以上内容由遇见数据集搜集并总结生成



