five

Multi-disease Paired Ocular Synthesis (MPOS)|眼科疾病数据集|图像合成数据集

收藏
arXiv2024-10-19 更新2024-10-23 收录
眼科疾病
图像合成
下载链接:
https://github.com/whq-xxh/FFA-Synthesis
下载链接
链接失效反馈
资源简介:
MPOS数据集是由香港科技大学(广州)和四川大学华西医院合作创建的,旨在支持眼科疾病的多模态图像合成研究。该数据集包含600对彩色眼底照片(CFP)和荧光素眼底血管造影(FFA)图像,涵盖五种不同的眼底疾病类别。数据集的创建过程包括图像采集、配对和标注,确保了数据的高质量和多样性。MPOS数据集的应用领域主要集中在通过非侵入性方法合成FFA图像,以提高眼科疾病的诊断准确性和患者安全性。
提供机构:
香港科技大学(广州)
创建时间:
2024-10-19
原始信息汇总

FFA-Synthesis 数据集概述

数据集名称

  • FFA-Synthesis

数据集来源

  • 来自 CFP(ACM MM 2024 Workshop)

数据集描述

  • 该数据集用于从 CFP 中合成 FFA(具体含义未明确)。
AI搜集汇总
数据集介绍
main_image_url
构建方式
在眼科诊断领域,多模态成像技术的发展为疾病的早期检测和治疗提供了重要支持。Multi-disease Paired Ocular Synthesis (MPOS) 数据集的构建旨在解决从非侵入性彩色眼底照片(CFP)到侵入性荧光素眼底血管造影(FFA)图像合成的挑战。该数据集收集了600对包含五种不同眼底疾病的CFP和FFA图像,涵盖健康、糖尿病视网膜病变(DR)、视网膜静脉阻塞(RVO)、年龄相关性黄斑变性(AMD)和中心性浆液性脉络膜视网膜病变(CSC)。数据集的构建过程严格遵循医学伦理标准,确保图像质量和数据对齐,为多疾病FFA合成研究提供了坚实的基础。
使用方法
MPOS数据集主要用于训练和验证从CFP到FFA图像合成的深度学习模型。研究者可以利用该数据集训练生成对抗网络(GAN)或其他图像合成模型,以提高FFA图像合成的质量和准确性。此外,数据集还可用于开发和测试多模态眼底疾病诊断模型,通过结合CFP和合成FFA图像,提升疾病诊断的精度和可靠性。数据集的公开性和详细文档支持了广泛的研究应用,促进了眼科影像分析技术的发展。
背景与挑战
背景概述
眼底成像技术在眼科诊断中占据核心地位,不同成像模式各具优势。例如,荧光素眼底血管造影(FFA)通过荧光素染料注射,能提供视网膜血管动态和病理的详细信息,超越彩色眼底照片(CFP)在检测微血管异常和血流状态方面的能力。然而,传统FFA的侵入性带来了不适和风险。因此,从非侵入性CFP合成FFA图像具有重要意义,但充满挑战。以往研究主要集中在单一疾病类别的FFA合成。本研究通过设计一种扩散引导的生成对抗网络,探索多疾病类别的FFA合成,并收集了首个多疾病配对眼底合成(MPOS)数据集,包含四种不同的眼底疾病。
当前挑战
MPOS数据集面临的挑战包括:1) 解决从非侵入性CFP到侵入性FFA图像合成的领域问题,特别是在多疾病类别中的应用;2) 数据集构建过程中遇到的挑战,如数据稀缺性和类别多样性的平衡。此外,生成对抗网络(GAN)在训练过程中的不稳定性,如模式崩溃,可能影响输出质量,而扩散模型的引入虽提高了图像质量,但也增加了计算成本。
常用场景
经典使用场景
在眼科领域,Multi-disease Paired Ocular Synthesis (MPOS) 数据集的经典应用场景主要集中在从非侵入性的彩色眼底照片(CFP)合成侵入性的荧光素眼底血管造影(FFA)图像。这种合成技术不仅能够提供详细的视网膜血管动态和病理信息,还能有效减少因荧光素注射带来的不适和风险。通过使用MPOS数据集,研究人员能够开发和验证基于扩散引导生成对抗网络(Diffusion-guided GAN)的新方法,从而在多种眼底疾病中实现高质量的FFA图像合成。
解决学术问题
MPOS数据集解决了在眼科研究中长期存在的从非侵入性成像到侵入性成像的转换难题。传统的FFA成像虽然提供了丰富的血管和病理信息,但其侵入性和潜在风险限制了其广泛应用。MPOS数据集通过提供多疾病类别的CFP和FFA配对图像,使得研究人员能够开发和验证新的合成算法,从而在不增加患者风险的情况下,实现高质量的FFA图像合成。这不仅推动了眼科诊断技术的发展,也为其他医学成像领域的研究提供了新的思路和方法。
实际应用
MPOS数据集在实际应用中展现出巨大的潜力,特别是在提高眼科疾病诊断的准确性和安全性方面。通过合成高质量的FFA图像,医生可以在不进行侵入性操作的情况下,获得详细的视网膜血管和病理信息,从而更准确地诊断和治疗糖尿病视网膜病变、视网膜静脉阻塞、年龄相关性黄斑变性等多种眼底疾病。此外,MPOS数据集的应用还可以扩展到远程医疗和人工智能辅助诊断系统中,进一步提升医疗服务的可及性和效率。
数据集最近研究
最新研究方向
在眼科领域,Multi-disease Paired Ocular Synthesis (MPOS) 数据集的最新研究方向主要集中在从非侵入性彩色眼底照片(CFP)合成侵入性荧光素眼底血管造影(FFA)图像。这一研究不仅解决了传统FFA方法带来的不适和风险,还通过引入扩散引导的生成对抗网络(Diffusion-guided GAN)和类别感知表示增强器(Category-aware Representation Enhancer),显著提升了合成FFA图像的质量。此外,该研究首次在多疾病类别中探索了CFP到FFA的合成,推动了眼科诊断技术的进步,特别是在减少患者伤害和提高诊断准确性方面具有重要意义。
相关研究论文
  • 1
    Non-Invasive to Invasive: Enhancing FFA Synthesis from CFP with a Benchmark Dataset and a Novel Network香港科技大学(广州) · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

glaive-function-calling-openai

该数据集包含用于训练和评估语言模型在函数调用能力上的对话示例。数据集包括一个完整的函数调用示例集合和一个精选的子集,专注于最常用的函数。数据集的结构包括一个完整的数据集和几个测试子集。每个记录都是一个JSON对象,包含对话消息、可用函数定义和实际的函数调用。数据集还包括最常用的函数分布信息,并提供了加载和评估数据集的示例代码。

huggingface 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录