哈佛青光眼检测与进展数据集 (Harvard-GDP)
收藏arXiv2023-08-25 更新2024-06-21 收录
下载链接:
https://ophai.hms.harvard.edu/datasets/harvard-gdp1000
下载链接
链接失效反馈官方服务:
资源简介:
哈佛青光眼检测与进展数据集(Harvard-GDP)是由哈佛医学院眼科系创建的多模态多任务数据集,包含1000名患者的OCT影像数据及青光眼检测和进展的标签。该数据集是目前最大的青光眼检测数据集,也是首个公开的青光眼进展预测数据集。数据集中的患者来自美国,种族多样性较高,可用于医学公平性研究。此外,数据集还提供了患者的年龄、性别和种族等人口统计信息,有助于更全面地分析青光眼的影响因素。
The Harvard Glaucoma Detection and Progression Dataset (Harvard-GDP) is a multi-modal, multi-task dataset created by the Department of Ophthalmology at Harvard Medical School. It contains OCT imaging data from 1000 patients, along with labels for glaucoma detection and progression. This dataset is currently the largest glaucoma detection dataset, as well as the first publicly available dataset for glaucoma progression prediction. Patients in this dataset are from the United States with high ethnic diversity, making it suitable for medical fairness research. In addition, the dataset also provides demographic information such as patients' age, gender, and ethnicity, which facilitates a more comprehensive analysis of the influencing factors of glaucoma.
提供机构:
哈佛医学院眼科系
创建时间:
2023-08-25
搜集汇总
数据集介绍
构建方式
为了解决青光眼检测和进展预测中3D OCT成像数据有限的问题,该数据集通过收集1000名患者的OCT影像数据以及青光眼检测和进展预测的标签来构建。数据集包括15,725个训练样本,1,047个验证样本和4,287个测试样本,其中一半样本未标记。数据集还提供了患者的人口统计学信息,包括年龄、性别和种族,这为公平性学习研究提供了可能。
使用方法
使用该数据集时,可以将其用于青光眼检测和进展预测任务的模型训练和评估。数据集提供了训练、验证和测试数据,并包含了未标记数据,可用于半监督学习模型的训练。此外,数据集还提供了人口统计学信息,可用于公平性学习研究。
背景与挑战
背景概述
青光眼作为全球不可逆失明的首要原因,其准确检测与进展预测面临着数据稀缺的瓶颈。哈佛青光眼检测与进展数据集(Harvard-GDP)应运而生,旨在解决这一问题。该数据集由哈佛大学眼科学AI实验室于2023年创建,包含来自1000名患者的OCT成像数据,以及青光眼检测和进展预测的标签信息。Harvard-GDP是迄今为止最大的包含3D OCT成像数据的青光眼检测数据集,也是首个公开的青光眼进展预测数据集。其详尽的性别和种族分析为公平性学习研究提供了宝贵资源,并已与多个SOTA监督CNN和transformer深度学习模型进行了基准测试。
当前挑战
Harvard-GDP数据集及其相关研究面临着以下挑战:1)青光眼检测和进展预测领域的数据稀缺问题,尤其是缺乏带有SOTA 3D OCT成像数据的标记患者数据;2)现有伪标签半监督学习方法在处理青光眼检测和进展预测任务时,由于视网膜生理性个体差异导致RNFLT图之间差异细微,难以提供足够指导来选择正确的伪标记样本;3)构建过程中,需要克服多模态数据建模的挑战,以及如何利用强化学习技术来确定伪标签,以改进分类模型的泛化能力。
常用场景
经典使用场景
哈佛青光眼检测与进展数据集 (Harvard-GDP) 主要用于青光眼检测和进展预测。该数据集包含来自 1000 名患者的 OCT 影像数据以及青光眼检测和进展的标签,是目前最大的包含 3D OCT 影像数据的青光眼检测数据集,也是第一个公开可用的青光眼进展预测数据集。该数据集可以帮助研究人员开发更准确的青光眼检测和进展预测模型,从而为临床诊断和治疗提供更有效的工具。
解决学术问题
哈佛青光眼检测与进展数据集解决了青光眼检测和进展预测中数据稀缺的问题。由于青光眼检测和进展预测需要大量的标注数据,而目前可用的标注数据非常有限,这限制了相关研究的发展。哈佛青光眼检测与进展数据集提供了大量的 OCT 影像数据和标注数据,为相关研究提供了重要的数据基础。此外,该数据集还包含了详细的性别和种族信息,可以帮助研究人员进行公平性学习研究。
实际应用
哈佛青光眼检测与进展数据集在实际应用中具有重要的价值。该数据集可以用于开发更准确的青光眼检测和进展预测模型,从而帮助临床医生进行更准确的诊断和治疗。此外,该数据集还可以用于开发青光眼筛查工具,从而降低社会疾病负担。哈佛青光眼检测与进展数据集的发布为青光眼研究和治疗提供了重要的数据支持,有助于提高青光眼诊断和治疗的水平。
数据集最近研究
最新研究方向
青光眼作为全球不可逆性失明的首要原因,其早期检测与进展预测对降低失明风险至关重要。然而,现有的研究面临着标注数据稀缺的挑战。哈佛青光眼检测与进展数据集 (Harvard-GDP) 的提出,旨在通过提供包含 1000 名患者 OCT 成像数据和青光眼检测与进展标签的多模态多任务数据集,缓解这一瓶颈。该数据集是迄今为止最大的 3D OCT 成像数据青光眼检测数据集,也是第一个公开可用的青光眼进展预测数据集。此外,该数据集还提供了详细的性别和种族分析,为公平性学习研究提供了可能性。
相关研究论文
- 1Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning哈佛医学院眼科系 · 2023年
以上内容由遇见数据集搜集并总结生成



