five

OCTA2024|医学影像数据集|图像处理数据集

收藏
arXiv2025-04-02 更新2025-04-07 收录
医学影像
图像处理
下载链接:
https://github.com/xmed-lab/MuTri
下载链接
链接失效反馈
资源简介:
OCTA2024数据集是由香港科技大学电子与计算机工程系收集的,包含846个受试者的OCT和OCTA三维体积数据对。该数据集旨在为OCT到OCTA的三维图像转换研究提供基准,推动相关领域的研究。数据集中的每个条目都是由3D OCT体积和对应的3D OCTA体积组成,来源于真实世界的受试者,为图像转换任务提供了丰富的数据来源。
提供机构:
香港科技大学电子与计算机工程系
创建时间:
2025-04-02
AI搜集汇总
数据集介绍
main_image_url
构建方式
OCTA2024数据集的构建基于多模态三维医学影像技术,采用双阶段向量量化变分自编码器(VQVAE)框架。第一阶段通过预训练两个独立的VQVAE模型,分别对846名受试者的OCT和OCTA体积数据进行重建,建立离散化的语义编码簿。第二阶段创新性地引入三视图对齐机制,通过对比学习驱动的语义对齐实现OCT与OCTA三维特征的互信息最大化,同时利用血管结构对齐从二维投影图中提取微血管网络特征。这种在离散有限空间中的跨模态映射方法,显著提升了视网膜血管结构的重建精度。
特点
作为当前最大规模的OCT-OCTA配对数据集,OCTA2024包含256×256×256分辨率的三维体积数据及其二维投影图,覆盖多种视网膜病变类型。其核心特点体现在多视图标注体系:三维OCT结构信息、三维OCTA血流动力学特征以及二维投影图的血管拓扑结构。数据集通过严格的设备校准和专家标注流程,确保了不同模态间空间配准精度达到亚像素级,为微血管网络分析提供了前所未有的多尺度研究基础。特别值得注意的是,该数据集首次实现了在离散编码空间中保留血管连续性特征的技术突破。
使用方法
该数据集支持端到端的OCT到OCTA转换任务,研究者可通过加载预训练的VQVAE编码器提取潜在特征,利用提供的三视图对齐损失函数优化模型。对于下游应用,建议采用两阶段训练策略:首先使用编码簿进行特征离散化,再通过对比学习对齐多视图特征空间。数据集已结构化分割为训练集(606例)、验证集(40例)和测试集(200例),并配套提供标准化的PSNR、SSIM和MAE评估脚本。对于血管形态学研究,推荐结合二维投影图的patch级相似度矩阵进行血管网络拓扑分析。
背景与挑战
背景概述
OCTA2024数据集由香港科技大学电子与计算机工程系的研究团队于2024年创建,旨在解决光学相干断层扫描血管成像(OCTA)领域的关键问题。该数据集包含846对3D OCT和OCTA图像,是目前该领域规模最大的公开数据集之一。研究团队提出了一种创新的多视图三对齐框架(MuTri),通过离散有限空间中的向量量化技术,实现了从OCT到OCTA的高质量图像转换。这一工作突破了传统方法在连续无限空间中学习的局限性,为视网膜微血管网络的精确成像提供了新的解决方案,对糖尿病视网膜病变、年龄相关性黄斑变性等眼部疾病的早期诊断具有重要临床价值。
当前挑战
OCTA2024数据集面临的主要挑战体现在两个方面:领域问题的挑战方面,传统OCTA成像依赖昂贵设备且难以普及,而现有OCT到OCTA的转换方法在连续无限空间中学习映射关系,导致血管结构细节丢失和转换质量受限;构建过程的挑战方面,大规模3D医学图像数据对的采集与标注成本高昂,且OCT与OCTA模态间存在显著域差距,使得量化编码本的优化变得异常困难。此外,如何有效利用预训练模型的多视图先验知识(包括3D OCT、3D OCTA和2D OCTA投影图)来指导转换过程,也是构建过程中需要解决的关键技术难题。
常用场景
经典使用场景
OCTA2024数据集在眼科医学影像领域具有广泛的应用价值,尤其在光学相干断层扫描血管成像(OCTA)的研究中表现突出。该数据集通过提供846对OCT和OCTA三维图像,为深度学习模型在OCT到OCTA图像转换任务中的训练和验证提供了丰富的数据支持。其经典使用场景包括利用多视图对齐框架(如MuTri)进行三维图像转换,从而在离散和有限空间中学习高质量的OCTA图像生成。
衍生相关工作
OCTA2024数据集推动了多项经典工作的衍生,包括基于生成对抗网络(GAN)的二维和三维图像转换方法(如Pix2Pix3D、TransPro)、向量量化技术(如VQ-I2I)以及扩散概率模型(如Palette)。这些工作进一步优化了OCT到OCTA的图像转换质量,并在多视图对齐、血管结构重建等方向取得了显著进展,为后续研究奠定了坚实基础。
数据集最近研究
最新研究方向
在眼科医学影像领域,OCTA2024数据集的推出标志着三维光学相干断层扫描血管成像(OCTA)技术的重要突破。该数据集包含846对OCT和OCTA体积数据,为深度学习模型提供了丰富的训练资源。最新研究聚焦于多视图三对齐框架(MuTri),通过离散有限空间中的向量量化技术,实现了从OCT到OCTA的高精度三维图像转换。这一方法不仅克服了传统连续无限空间映射的局限性,还通过对比启发的语义对齐和血管结构对齐,显著提升了血管网络的细节还原能力。研究进一步验证了该方法在糖尿病视网膜病变等眼底疾病诊断中的潜在应用价值,为低成本OCT设备升级提供了新思路。
相关研究论文
  • 1
    MuTri: Multi-view Tri-alignment for OCT to OCTA 3D Image Translation香港科技大学电子与计算机工程系 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

OQMD

12W+DFT计算数据,包括热力学和结构性质label

OpenDataLab 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录