five

Eyecare-100K|眼科图像分析数据集|疾病诊断数据集

收藏
arXiv2025-04-18 更新2025-04-22 收录
眼科图像分析
疾病诊断
下载链接:
https://github.com/DCDmllm/EyecareGPT
下载链接
链接失效反馈
资源简介:
Eyecare-100K是一个高质量的眼科视觉指令数据集,由浙江大学等机构联合构建。该数据集汇集了8种成像模式、15种以上解剖结构和100多种眼科疾病,共包含约102000个视觉问答对,是首个同时涵盖多模态、多任务和多疾病的眼科数据集,为眼科智能理解的多模态智能研究提供了关键资源。
提供机构:
浙江大学, 哈尔滨工业大学, 郴州市第一人民医院, 新加坡国立大学
创建时间:
2025-04-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
Eyecare-100K数据集的构建采用了多智能体数据引擎技术,整合了来自13个公共数据集、3家医院和3个公共医学案例库的真实世界眼科数据。该数据集覆盖了8种成像模态、15种以上解剖结构和100多种眼科疾病,通过信息提取、清洗、格式化和专家评审等步骤,最终生成了约102,000个视觉问答对。这一构建过程确保了数据的高质量和多样性,为眼科多模态智能理解提供了关键资源。
特点
Eyecare-100K数据集的特点在于其全面性和多样性。它不仅涵盖了多种眼科成像模态和解剖结构,还包含了丰富的疾病类型和任务形式。数据集中的视觉问答对分为封闭式问答、开放式问答和报告生成三种类型,支持细粒度的视觉理解和推理任务。此外,数据集还整合了时间序列数据和空间序列数据,进一步增强了其在复杂临床场景中的适用性。
使用方法
Eyecare-100K数据集的使用方法主要包括三个方面:首先,可用于训练和优化医学大型视觉语言模型(Med-LVLMs),提升其在眼科诊断任务中的性能;其次,可作为基准测试数据集,用于评估模型在多模态眼科图像理解和报告生成任务中的表现;最后,还可用于研究眼科疾病的智能诊断算法,推动眼科人工智能领域的发展。数据集的结构化设计和高质量标注使其能够灵活应用于多种研究和应用场景。
背景与挑战
背景概述
Eyecare-100K是由浙江大学、哈尔滨工业大学、新加坡国立大学等机构的研究团队于2025年推出的眼科多模态视觉指令数据集。该数据集整合了13个公共数据集、3家医院和3个医学案例库的资源,涵盖8种成像模态(如OCT、眼底摄影、超声生物显微镜等)、15个以上解剖结构和100多种眼部疾病。作为首个同时涵盖多模态、多任务和多疾病的综合性眼科数据集,Eyecare-100K通过多智能体数据引擎实现了高质量的数据标注与结构化处理,为医学大视觉语言模型(Med-LVLMs)在眼科领域的细粒度视觉理解和智能诊断研究提供了关键支持。其创新性地支持视觉问答、报告生成等临床任务,显著推动了智能眼科诊断技术的发展。
当前挑战
Eyecare-100K针对眼科智能诊断面临三大核心挑战:1) 数据层面,现有眼科数据集多为单一模态和粗粒度标注,缺乏深度注释的异构多模态视觉指令数据;2) 评估层面,缺乏系统性的基准测试体系来全面衡量模型在闭卷问答、开放问答和报告生成等多维任务中的临床诊断性能;3) 模型层面,传统Med-LVLMs的全局视觉特征提取机制难以适应眼科影像的细粒度和区域特异性识别需求。在构建过程中,研究团队需克服多模态数据标准化整合、专业医学术语翻译一致性、以及高分辨率时序影像(如FFA/ICGA)的动态特征捕捉等技术难题,最终通过自适应分辨率机制和分层密集连接器等创新设计实现突破。
常用场景
经典使用场景
在眼科医学领域,Eyecare-100K数据集通过整合8种成像模态和100余种眼部疾病的高质量视觉指令数据,为多模态眼科诊断任务提供了标准化支持。其经典应用场景包括基于光学相干断层扫描(OCT)和眼底图像的疾病分级问答、病灶定位分析以及多模态报告生成。例如,模型可通过分析OCT图像准确识别年龄相关性黄斑变性(AMD)的典型特征,或通过荧光素血管造影(FA)序列图像生成糖尿病视网膜病变的详细诊断报告。
衍生相关工作
该数据集催生了多项眼科AI重要研究:基于其构建的EyecareGPT模型在OmniMedVQA基准上实现100%的OCT子任务准确率,相关技术已扩展至LLaVA-Med等通用医学模型;其多模态标注范式被LMOD数据集借鉴,推动了五模态眼科数据标准的建立;此外,其提出的GPT-4辅助报告评估体系被HealthGPT等后续工作采用,形成了临床错误率(指标I)和结构清晰度(指标H)等可量化的质量标准,为行业提供了可复用的评估框架。
数据集最近研究
最新研究方向
近年来,Eyecare-100K数据集在眼科医学影像分析领域引起了广泛关注。该数据集整合了8种成像模态、15种以上眼部解剖结构和100多种眼科疾病,为多模态视觉问答和报告生成任务提供了丰富的数据支持。随着医学大视觉语言模型(Med-LVLMs)的快速发展,Eyecare-100K通过其细粒度标注和多样化任务设计,显著提升了模型在智能眼科诊断中的性能。当前研究热点集中在三个方面:多模态特征融合、自适应分辨率机制和层级密集连接器的优化。这些技术突破不仅解决了眼科影像中区域特异性病变识别的挑战,还为开放域智能眼科研究奠定了重要基础。该数据集的推出填补了高质量眼科视觉指令数据的空白,其配套的EyecareBench评估体系为模型性能提供了多维度、临床导向的测试标准,对推动精准医疗和远程眼科会诊具有重要价值。
相关研究论文
  • 1
    EyecareGPT: Boosting Comprehensive Ophthalmology Understanding with Tailored Dataset, Benchmark and Model浙江大学, 哈尔滨工业大学, 郴州市第一人民医院, 新加坡国立大学 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。

hugging_face 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录