five

RadIR

收藏
Hugging Face2025-04-04 更新2025-04-07 收录
下载链接:
https://huggingface.co/datasets/zzh99/RadIR
下载链接
链接失效反馈
官方服务:
资源简介:
RadIR是一个通过放射学报告挖掘实现的多粒度医学图像检索的可扩展框架的官方数据仓库。该数据集扩展了两个公开数据集MIMIC-CXR和CTRATE,形成了MIMIC-IR和CTRATE-IR,分别包含377,110张图像和90个解剖结构,以及25,692张图像和48个解剖结构。数据集通过配对的报告提取不同解剖结构的信息,并使用RaTEScore来量化图像间的相关性。
创建时间:
2025-04-02
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像检索领域,RadIR数据集通过创新性地挖掘放射学报告与图像的关联关系,构建了一个多粒度医学图像检索框架。该数据集扩展自两个权威公开数据集:基于MIMIC-CXR构建的MIMIC-IR包含377,110张图像和90个解剖结构标注,基于CTRATE构建的CTRATE-IR包含25,692张图像和48个解剖结构标注。研究人员采用RaTEScore算法量化图像间的多粒度相关性,通过解析放射报告中的解剖结构发现,建立了细粒度的图像相似性评估体系。
使用方法
使用RadIR数据集时,研究人员可通过Python脚本灵活访问不同层次的检索数据。对于解剖结构级别的检索,需加载对应的CSV标注文件和npy相似度矩阵;整体图像检索则需读取JSONL格式的元数据文件。数据集提供了清晰的代码示例,展示如何获取样本ID、放射报告文本及相似度评分。需要注意的是,MIMIC-IR数据需要手动合并和解压多个分卷文件。原始图像数据需从MIMIC-CXR或CTRATE等源数据集获取,但样本ID保持完全对应,确保了数据使用的连贯性。
背景与挑战
背景概述
RadIR数据集由MAGIC-AI4Med研究团队于2025年提出,旨在通过放射学报告挖掘构建多粒度医学图像检索框架。该数据集基于MIMIC-CXR和CTRATE两大公开医学影像数据集扩展而成,分别包含377,110张胸部X光图像和25,692张CT影像,涵盖138个解剖结构标注。研究团队创新性地开发了RaTEScore评分系统,通过量化影像-报告对的多粒度相关性,解决了传统医学影像检索中语义鸿沟的关键问题。该框架为医学影像分析领域提供了首个支持从器官级到病灶级的跨模态检索基准,显著推动了精准医疗和计算机辅助诊断的发展。
当前挑战
医学影像检索领域长期面临跨模态对齐的挑战,RadIR需解决放射报告专业术语与视觉特征的细粒度匹配难题。数据集构建过程中,研究人员需处理原始数据中存在的报告表述差异、影像质量不均等问题,并通过人工校验确保解剖结构标注的准确性。技术层面,多粒度相关性评分系统RaTEScore的开发涉及复杂的自然语言处理与深度学习模型融合,需平衡计算效率与评分精度。此外,数据规模带来的存储与处理压力也构成实施挑战,如MIMIC-IR需特殊的分卷压缩处理方案。这些挑战反映了医学人工智能领域数据标准化与算法鲁棒性的核心需求。
常用场景
经典使用场景
RadIR数据集在医学影像检索领域具有重要价值,其多粒度图像检索框架通过挖掘放射学报告中的解剖结构信息,为研究者提供了丰富的图像-文本关联数据。该数据集特别适用于开发基于深度学习的医学影像检索系统,能够支持从整体图像到特定解剖结构的细粒度检索任务。在医学影像分析领域,RadIR的引入填补了传统方法在跨模态检索和多粒度分析方面的不足。
解决学术问题
RadIR数据集有效解决了医学影像检索中的关键学术问题,包括跨模态对齐、多粒度语义匹配以及大规模医学图像检索的挑战。通过量化图像间的多粒度相关性(RaTEScore),该数据集为研究者提供了可靠的评估基准,推动了医学影像检索算法的性能提升。其扩展的MIMIC-IR和CTRATE-IR子集覆盖了多种解剖结构,为医学影像的细粒度分析提供了重要数据支持。
实际应用
在实际医疗场景中,RadIR数据集可应用于临床决策支持系统,帮助医生快速检索相似病例的影像和报告。该数据集构建的多粒度检索框架能够辅助放射科医生进行疾病诊断和治疗方案制定,特别是在罕见病例分析和医学教育领域具有显著价值。通过提高医学影像检索的准确性和效率,RadIR为智慧医疗的发展提供了重要技术支撑。
数据集最近研究
最新研究方向
在医学影像检索领域,RadIR数据集通过挖掘放射学报告中的多层次解剖结构信息,为多粒度医学图像检索任务提供了重要支持。该数据集基于MIMIC-CXR和CTRATE两大公开数据集进行扩展,分别包含377,110张图像和90种解剖结构、25,692张图像和48种解剖结构,为研究者提供了丰富的实验数据。近年来,随着深度学习在医学影像分析中的广泛应用,RadIR数据集在跨模态检索、图像-文本对齐以及基于解剖结构的细粒度检索等方向展现出巨大潜力。特别是其采用的RaTEScore量化方法,为评估图像间多层次相关性提供了可靠标准。该框架的提出,不仅推动了医学影像检索技术的发展,也为临床辅助诊断系统的智能化升级提供了新的研究思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作