BenchReAD
收藏arXiv2025-07-15 更新2025-07-16 收录
下载链接:
https://github.com/DopamineLcy/BenchReAD
下载链接
链接失效反馈官方服务:
资源简介:
BenchReAD是一个全面的视网膜异常检测基准,包含两种最常用的视网膜成像模式:眼底摄影和光学相干断层扫描(OCT)。该基准包含大量数据集,涵盖了多种异常类型,能够进行严格的泛化评估。数据集由多个公开数据集整合而成,包括EDDFS、BRSET、RIADD、JSIEC、OCT 2017、OCTDL和OCTID等。BenchReAD旨在为视网膜异常检测提供一个系统性和全面性的基准,促进该领域的发展。
BenchReAD is a comprehensive benchmark for retinal abnormality detection, encompassing the two most widely utilized retinal imaging modalities: fundus photography and optical coherence tomography (OCT). It incorporates a large-scale collection of datasets spanning diverse abnormality categories, enabling rigorous generalization assessment. This benchmark is compiled from multiple publicly available datasets, such as EDDFS, BRSET, RIADD, JSIEC, OCT 2017, OCTDL, OCTID, and others. BenchReAD is designed to offer a systematic and comprehensive benchmark for retinal abnormality detection, thereby facilitating the advancement of the relevant research field.
提供机构:
香港理工大学智能健康中心护理学院, 清华大学生物医学工程系, 中国科学院深圳先进技术研究院医疗人工智能研究中心
创建时间:
2025-07-15
原始信息汇总
BenchReAD 数据集概述
数据集简介
- 官方代码库:BenchReAD: A systematic benchmark for retinal anomaly detection (MICCAI 2025)
- 包含眼底图像(fundus)和光学相干断层扫描(OCT)两个基准数据集
数据集构建
1. 眼底图像基准数据集
训练集与验证集
- 数据来源:
- EDDFS数据集(https://github.com/xia-xx-cv/EDDFS_dataset)
- BRSET数据集(https://physionet.org/content/brazilian-ophthalmological/1.0.1/)
- 预处理步骤:
- EDDFS数据预处理使用EDDFS_preprocessing.ipynb
- EDDFS数据分割使用EDDFS_split.ipynb
- BRSET数据预处理使用BRSET_preprocessing.ipynb
- BRSET数据分割使用BRSET_split.ipynb
测试集
- 数据来源:
- RIADD数据集(https://riadd.grand-challenge.org/)
- JSIEC数据集(https://www.kaggle.com/datasets/linchundan/fundusimage1000)
- 预处理步骤:
- RIADD数据预处理使用RIADD_preprocessing.ipynb
- RIADD数据分割使用RIADD_split.ipynb
- JSIEC数据预处理使用JSIEC.ipynb
2. OCT基准数据集
训练集与验证集
- 数据来源:
- OCT 2017数据集(https://www.kaggle.com/datasets/paultimothymooney/kermany2018)
- 预处理步骤:
- OCT 2017数据预处理使用OCT_2017_preprocessing.ipynb
- OCT 2017数据分割使用OCT_2017_split.ipynb
测试集
- 数据来源:
- OCTDL数据集(https://data.mendeley.com/datasets/sncdhf53xc/4)
- OCTID数据集(https://www.kaggle.com/datasets/saifurrahmanshatil/retinal-oct-dataset)
- 预处理步骤:
- OCTDL数据预处理使用OCTDL.ipynb
- OCTID数据预处理使用OCTID_step1.ipynb和OCTID_step2.ipynb
参考文献
- Xia, X., et al. Benchmarking deep models on retinal fundus disease diagnosis and a large-scale dataset. Signal Processing: Image Communication 127, 117151 (2024).
- Nakayama, L.F., et al. Brset: A brazilian multilabel ophthalmological dataset of retina fundus photos. PLOS Digital Health 3(7), e0000454 (2024).
- Pachade, S., et al. Retinal fundus multi-disease image dataset (rfmid): a dataset for multi-disease detection research. Data 6(2), 14 (2021)
- Cen, L.P., et al. Automatic detection of 39 fundus diseases and conditions in retinal photographs using deep neural networks. Nature communications 12(1), 4828 (2021)
- Kermany, D.S., et al. Identifying medical diagnoses and treatable diseases by image-based deep learning. cell 172(5), 1122–1131 (2018)
- Kulyabin, M., et al. Octdl: Optical coherence tomography dataset for image-based deep learning methods. Scientific Data 11(1), 365 (2024)
- Gholami, P., et al. Octid: Optical coherence tomography image database. Computers & Electrical Engineering 81, 106532 (2020)
搜集汇总
数据集介绍

构建方式
在视网膜异常检测领域,BenchReAD数据集的构建采用了多源数据集整合策略,涵盖眼底照相和光学相干断层扫描(OCT)两种主流成像模态。研究团队从EDDFS、BRSET等公开数据集中提取训练集与验证集,并整合RIADD、JSIEC等多样化测试集,最终形成包含23,361张正常图像和16,388张异常图像的训练集。测试集特别设计包含已知异常类型(如糖尿病视网膜病变)和未见异常类型(如黄斑裂孔),通过严格筛选确保每类异常样本不少于20例,保障了统计效度。OCT模块则整合OCT 2017、OCTDL等数据集,构建包含25,840正常样本和53,702异常样本的大规模训练集。
特点
BenchReAD的核心特征体现在其系统性与全面性:首先,该数据集覆盖12类眼底异常和9类OCT异常,规模远超APTOS、LAG等现有基准;其次,创新性地引入未见异常评估模块,包含黄斑水肿、视网膜静脉阻塞等16种临床罕见病变,有效检验模型泛化能力;此外,数据集支持无监督、单类监督、半监督和全监督四类算法的标准化评估,首次在医学异常检测领域实现多监督层次的系统比对。实验表明,其测试集在AUC指标上呈现显著区分度(如RIADD数据集89.0 vs 随机猜测50.0),验证了数据集的鉴别效力。
使用方法
使用BenchReAD需遵循其分层评估框架:研究人员可选择不同监督等级的子数据集进行训练,如单类监督仅使用正常样本(Nx, Ny),全监督则联合正常与异常标注数据(Ax, Ay)。评估阶段需在独立测试集上计算阈值无关指标(AUROC)和临床相关指标(F1分数、敏感性)。基准代码库提供标准化预处理流程和特征提取工具,特别推荐集成正常特征记忆库(NFM)的NFM-DRA方法,该方法通过比较测试样本与记忆库特征距离(式2)优化预测,在RIADD数据集上将未见异常检测F1分数提升17.8%。所有实验建议在PyTorch环境下使用NVIDIA GPU加速。
背景与挑战
背景概述
BenchReAD是由香港理工大学、清华大学和中国科学院深圳先进技术研究院的研究团队于2023年提出的视网膜异常检测系统性基准数据集。该数据集针对视网膜影像分析领域长期存在的评估标准缺失问题,整合了七种公开数据集,涵盖眼底照相和光学相干断层扫描(OCT)两种主流成像模态,包含23,361张正常图像和16,388张异常图像。其创新性体现在首次系统性地构建了包含可见异常(训练集出现)与不可见异常(训练集未出现)的双重评估体系,并建立了涵盖无监督、单类监督、半监督和全监督四种学习范式的统一评测框架。该基准的建立有效解决了既往研究中异常类型单一、测试集性能饱和、泛化评估缺失等关键问题,为糖尿病视网膜病变、青光眼等眼疾的智能筛查提供了标准化评估工具。
当前挑战
在领域问题层面,BenchReAD面临三大核心挑战:视网膜异常形态的高度异质性导致特征提取困难,细微病变与正常组织的区分度低,以及多病种共存的复杂诊断场景。数据构建过程中,研究团队需要克服多源数据标准化难题,包括不同设备的成像差异、病灶标注标准不统一等问题。特别在处理不可见异常类别时,需确保测试集具有足够的统计显著性(每类≥20张图像)。算法层面,全监督方法DRA虽在可见异常检测表现优异,但对不可见异常的识别存在显著性能下降,如对黄斑裂孔(MH)等罕见病变的检测AUC值下降达42.7%。这揭示了现有方法在临床未知异常识别上的局限性,促使团队提出融合正常特征记忆库的NFM-DRA改进方案。
常用场景
经典使用场景
BenchReAD数据集在视网膜异常检测领域具有广泛的应用价值,其经典使用场景包括对糖尿病视网膜病变、青光眼、黄斑变性等常见视网膜疾病的筛查与诊断。该数据集通过整合多种视网膜成像模态(如眼底摄影和光学相干断层扫描),为研究人员提供了一个全面且多样化的评估平台。其独特的测试集设计,包含已见和未见异常类别,使得模型能够在更接近真实临床场景的条件下进行评估,从而显著提升了研究的实用性和可靠性。
解决学术问题
BenchReAD数据集解决了视网膜异常检测领域长期存在的多个学术问题。首先,它弥补了现有数据集中异常类型单一且过于简化的缺陷,通过纳入多种常见和罕见视网膜疾病,显著提升了模型的泛化能力。其次,该数据集打破了传统测试集性能饱和的局限,通过引入未见异常类别,为模型鲁棒性评估提供了更严格的标准。此外,BenchReAD首次系统性地评估了不同监督水平下的算法性能,包括无监督、单类监督、半监督和全监督方法,为学术界提供了全面的算法比较基准。
衍生相关工作
BenchReAD数据集已衍生出多个经典研究工作,其中最具代表性的是NFM-DRA方法。该方法通过将异常解耦表示(DRA)与正常特征记忆库相结合,显著提升了模型对未见异常的检测能力。此外,基于该数据集的算法比较研究为PatchCore等记忆库方法在医学异常检测中的应用提供了新思路。BenchReAD还启发了对阈值依赖指标的深入研究,推动学界重新思考临床实用化评估标准,相关成果发表在CVPR、MedIA等顶级期刊会议上。
以上内容由遇见数据集搜集并总结生成



