Eyecare-100K|眼科图像分析数据集|疾病诊断数据集

arXiv2025-04-18 更新2025-04-22 收录

下载链接：

https://github.com/DCDmllm/EyecareGPT

下载链接

链接失效反馈

资源简介：

Eyecare-100K是一个高质量的眼科视觉指令数据集，由浙江大学等机构联合构建。该数据集汇集了8种成像模式、15种以上解剖结构和100多种眼科疾病，共包含约102000个视觉问答对，是首个同时涵盖多模态、多任务和多疾病的眼科数据集，为眼科智能理解的多模态智能研究提供了关键资源。

提供机构：

浙江大学, 哈尔滨工业大学, 郴州市第一人民医院, 新加坡国立大学

创建时间：

2025-04-18

AI搜集汇总

数据集介绍

构建方式

Eyecare-100K数据集的构建采用了多智能体数据引擎技术，整合了来自13个公共数据集、3家医院和3个公共医学案例库的真实世界眼科数据。该数据集覆盖了8种成像模态、15种以上解剖结构和100多种眼科疾病，通过信息提取、清洗、格式化和专家评审等步骤，最终生成了约102,000个视觉问答对。这一构建过程确保了数据的高质量和多样性，为眼科多模态智能理解提供了关键资源。

特点

Eyecare-100K数据集的特点在于其全面性和多样性。它不仅涵盖了多种眼科成像模态和解剖结构，还包含了丰富的疾病类型和任务形式。数据集中的视觉问答对分为封闭式问答、开放式问答和报告生成三种类型，支持细粒度的视觉理解和推理任务。此外，数据集还整合了时间序列数据和空间序列数据，进一步增强了其在复杂临床场景中的适用性。

使用方法

Eyecare-100K数据集的使用方法主要包括三个方面：首先，可用于训练和优化医学大型视觉语言模型（Med-LVLMs），提升其在眼科诊断任务中的性能；其次，可作为基准测试数据集，用于评估模型在多模态眼科图像理解和报告生成任务中的表现；最后，还可用于研究眼科疾病的智能诊断算法，推动眼科人工智能领域的发展。数据集的结构化设计和高质量标注使其能够灵活应用于多种研究和应用场景。

背景与挑战

背景概述

Eyecare-100K是由浙江大学、哈尔滨工业大学、新加坡国立大学等机构的研究团队于2025年推出的眼科多模态视觉指令数据集。该数据集整合了13个公共数据集、3家医院和3个医学案例库的资源，涵盖8种成像模态（如OCT、眼底摄影、超声生物显微镜等）、15个以上解剖结构和100多种眼部疾病。作为首个同时涵盖多模态、多任务和多疾病的综合性眼科数据集，Eyecare-100K通过多智能体数据引擎实现了高质量的数据标注与结构化处理，为医学大视觉语言模型（Med-LVLMs）在眼科领域的细粒度视觉理解和智能诊断研究提供了关键支持。其创新性地支持视觉问答、报告生成等临床任务，显著推动了智能眼科诊断技术的发展。

当前挑战

Eyecare-100K针对眼科智能诊断面临三大核心挑战：1) 数据层面，现有眼科数据集多为单一模态和粗粒度标注，缺乏深度注释的异构多模态视觉指令数据；2) 评估层面，缺乏系统性的基准测试体系来全面衡量模型在闭卷问答、开放问答和报告生成等多维任务中的临床诊断性能；3) 模型层面，传统Med-LVLMs的全局视觉特征提取机制难以适应眼科影像的细粒度和区域特异性识别需求。在构建过程中，研究团队需克服多模态数据标准化整合、专业医学术语翻译一致性、以及高分辨率时序影像（如FFA/ICGA）的动态特征捕捉等技术难题，最终通过自适应分辨率机制和分层密集连接器等创新设计实现突破。

常用场景

经典使用场景

在眼科医学领域，Eyecare-100K数据集通过整合8种成像模态和100余种眼部疾病的高质量视觉指令数据，为多模态眼科诊断任务提供了标准化支持。其经典应用场景包括基于光学相干断层扫描（OCT）和眼底图像的疾病分级问答、病灶定位分析以及多模态报告生成。例如，模型可通过分析OCT图像准确识别年龄相关性黄斑变性（AMD）的典型特征，或通过荧光素血管造影（FA）序列图像生成糖尿病视网膜病变的详细诊断报告。

衍生相关工作

该数据集催生了多项眼科AI重要研究：基于其构建的EyecareGPT模型在OmniMedVQA基准上实现100%的OCT子任务准确率，相关技术已扩展至LLaVA-Med等通用医学模型；其多模态标注范式被LMOD数据集借鉴，推动了五模态眼科数据标准的建立；此外，其提出的GPT-4辅助报告评估体系被HealthGPT等后续工作采用，形成了临床错误率（指标I）和结构清晰度（指标H）等可量化的质量标准，为行业提供了可复用的评估框架。

数据集最近研究