five

EYEPACS

收藏
Hugging Face2025-11-04 更新2025-11-05 收录
下载链接:
https://huggingface.co/datasets/ctmedtech/EYEPACS
下载链接
链接失效反馈
官方服务:
资源简介:
EyePACS(糖尿病视网膜病变基金图像数据集)是一个大规模的视网膜基金图像集合,用于自动糖尿病视网膜病变检测。包含大约88,702张在临床筛查条件下拍摄的黄斑中心彩色视网膜基金图像。图像根据糖尿病视网膜病变的严重程度分为五个等级,由眼科专家按照ICDR尺度进行标注。数据集存在显著的类不平衡问题,使用受到Kaggle和EyePACS条款的限制。

EyePACS (Diabetic Retinopathy Fundus Image Dataset) is a large-scale collection of retinal fundus images designed for automated diabetic retinopathy detection. It contains approximately 88,702 color macular-centered retinal fundus images captured under clinical screening conditions. The images are classified into five severity grades of diabetic retinopathy, annotated by ophthalmologists in accordance with the ICDR scale. The dataset has significant class imbalance, and its usage is restricted by the terms and conditions of Kaggle and EyePACS.
创建时间:
2025-10-31
原始信息汇总

EyePACS — 糖尿病视网膜病变眼底图像数据集

数据集概述

EyePACS(Eye Picture Archive Communication System)是一个大规模视网膜眼底图像集合,用于自动化糖尿病视网膜病变检测。该数据集构成了Kaggle糖尿病视网膜病变检测挑战赛的基础,支持DR分类和筛查研究。

数据集包含来自真实世界临床筛查的黄斑中心彩色眼底图像,涵盖各种成像条件。

数据集基本信息

  • 任务类型:糖尿病视网膜病变分类(5个严重程度等级)
  • 数据描述:来自EyePACS DR筛查项目的高分辨率彩色眼底照片,每张图像由眼科医生使用ICDR量表标注
  • 数据规模:总计约88,702张图像(约35,000张带训练标签,约53,000张无标签测试图像)
  • 图像类型:黄斑中心彩色眼底照片(分辨率640×480至5184×3456像素)
  • 数据来源:通过Kaggle糖尿病视网膜病变检测挑战赛(2015年)获取的EyePACS(美国)数据
  • 访问方式:https://www.kaggle.com/c/diabetic-retinopathy-detection/data
  • 许可协议:受Kaggle和EyePACS条款限制使用

类别标签

  • 0 = 无糖尿病视网膜病变
  • 1 = 轻度
  • 2 = 中度
  • 3 = 重度
  • 4 = 增殖性糖尿病视网膜病变

数据集结构

eyepacs/ ├── images/ │ ├── train/ │ │ ├── 00001_left.jpg │ │ ├── 00001_right.jpg │ └── test/ ├── labels.csv # 包含image_id, eye(L/R), dr_grade (0–4) ├── README.md └── LICENSE.txt

标签详细信息

  • 标签遵循国际临床糖尿病视网膜病变分级系统
  • 存在显著的类别不平衡问题——大多数图像显示无糖尿病视网膜病变
  • 标签由认证眼科医生分配,可能存在少量标签噪声

预处理建议

  • 裁剪至圆形眼底区域并移除边框
  • 调整为一致分辨率(如1024×1024)
  • 标准化光照和对比度
  • 排除模糊或不可分级图像

研究应用

  • 糖尿病视网膜病变检测和严重程度分类
  • 自动化视网膜筛查系统
  • 跨成像条件的迁移学习和鲁棒性测试
  • 与MESSIDOR、DDR和APTOS等数据集的比较研究

注意事项与限制

  • 显著的类别不平衡(多数为无糖尿病视网膜病变)
  • 相机类型、曝光和对焦存在差异
  • 存在部分标签噪声和不可分级图像
  • 重新分发可能受限——发布图像前请验证Kaggle/EyePACS条款

引用信息

如使用该数据集,请引用:

Kaggle and EyePACS. "Diabetic Retinopathy Detection." Kaggle Competition, 2015. https://www.kaggle.com/c/diabetic-retinopathy-detection

参考资源

  • EyePACS官方数据页面:https://www.eyepacs.com/data-analysis
  • Kaggle:糖尿病视网膜病变检测:https://www.kaggle.com/c/diabetic-retinopathy-detection
搜集汇总
数据集介绍
main_image_url
构建方式
在糖尿病视网膜病变自动筛查研究领域,EyePACS数据集通过EyePACS临床筛查系统采集了约88,702张黄斑中心彩色眼底图像。这些图像源自真实世界临床环境,涵盖了不同摄影设备和成像条件,由认证眼科医师严格遵循国际临床糖尿病视网膜病变分级标准进行五级严重程度标注。数据采集过程特别注重保留临床实践中的多样性,包括不同分辨率(640×480至5184×3456像素)和图像质量,为构建具有临床代表性的机器学习模型奠定了坚实基础。
特点
该数据集最显著的特征在于其大规模临床影像集合与精细的病理分级体系。所有图像均采用黄斑中心拍摄视角,完整呈现糖尿病视网膜病变的典型病理特征。数据集遵循国际公认的五级严重程度分类标准(0-4级),但存在明显的类别不平衡现象——绝大多数样本属于无病变类别。这种分布特征真实反映了临床筛查中疾病发生率的特点,同时图像质量存在因拍摄设备差异导致的曝光度、对焦精度等自然变异,为模型鲁棒性研究提供了宝贵资源。
使用方法
研究人员可通过Kaggle平台申请获取该数据集,在使用过程中建议实施系统的图像预处理流程。首先应裁剪圆形眼底区域并去除边界伪影,继而统一缩放至标准分辨率(如1024×1024像素),同时进行光照均衡和对比度标准化处理。对于质量较差的模糊图像或不可分级样本,推荐在训练前予以剔除。该数据集主要适用于糖尿病视网膜病变的自动检测与严重程度分类研究,也可作为迁移学习的预训练资源,或用于评估模型在不同成像条件下的泛化能力。
背景与挑战
背景概述
EYEPACS数据集由美国眼科影像通信系统于2015年创建,作为Kaggle糖尿病视网膜病变检测挑战赛的核心数据资源。该数据集汇集了来自真实临床筛查环境的88,702张视网膜眼底图像,由认证眼科医师依据国际临床糖尿病视网膜病变分级标准进行五级严重程度标注。其诞生标志着医学影像分析领域向大规模自动化筛查的重要转型,为糖尿病视网膜病变的早期诊断与分级提供了关键研究基础,显著推动了计算机辅助诊断技术在眼科医学中的应用进程。
当前挑战
该数据集面临的核心挑战体现在算法开发与数据质量两个维度。在算法层面,严重的类别不平衡问题导致模型对少数类别的识别精度不足,同时眼底图像在拍摄设备、光照条件和焦距参数上的显著差异对模型泛化能力构成严峻考验。数据构建过程中,不同医师标注标准的主观差异引入了标签噪声,部分图像因拍摄质量不佳而难以分级,且高分辨率图像的存储与处理对计算资源提出了较高要求,这些因素共同制约着自动化诊断系统的实际部署效果。
常用场景
经典使用场景
在眼科医学影像分析领域,EYEPACS数据集作为糖尿病视网膜病变自动筛查的基准资源,其最经典的应用场景在于构建深度学习模型对眼底图像进行五级严重程度分类。该数据集通过大量真实临床环境采集的彩色眼底照片,为研究人员提供了标准化数据基础,支持从无病变到增殖性病变的完整分级体系验证。
实际应用
在实际医疗场景中,基于EYEPACS训练的模型已应用于初级卫生机构的自动化筛查系统,有效辅助非专科医生进行病变初筛。这类系统能够显著提升偏远地区的诊疗可及性,通过快速识别需转诊的重症患者,优化医疗资源分配并降低糖尿病致盲风险。
衍生相关工作
该数据集催生了诸多经典研究,如Kaggle竞赛中涌现的卷积神经网络架构优化方案,以及后续提出的对抗训练、注意力机制等先进方法。这些工作不仅推动了MESSIDOR、APTOS等数据集的跨域验证研究,更促进了《JAMA Ophthalmology》等顶级期刊发表的临床验证论文。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作