BIMCV-R

Name: BIMCV-R
Creator: 中国科学技术大学, 帝国理工学院
Published: 2024-03-24 11:10:07
License: 暂无描述

arXiv2024-03-24 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2403.15992v1

下载链接

链接失效反馈

官方服务：

资源简介：

BIMCV-R是由中国科学技术大学和帝国理工学院合作创建的一个开创性3D医学图像数据集，包含8,069个3D CT体积数据，覆盖超过200万张切片，并配有相应的放射学报告。该数据集通过严格的图像筛选和文本翻译（从西班牙语到英语）过程创建，确保了数据的质量和可靠性。BIMCV-R主要用于支持3D医学文本-图像检索系统的开发，旨在通过提供丰富的病例资料，帮助医生和研究人员更有效地进行疾病诊断和治疗规划。

BIMCV-R is a pioneering 3D medical imaging dataset jointly developed by the University of Science and Technology of China and Imperial College London. It comprises 8,069 3D CT volumetric datasets, covering over 2 million slices, and is paired with corresponding radiology reports. This dataset was constructed via a rigorous workflow including image filtering and text translation (from Spanish to English), ensuring its data quality and reliability. Primarily intended to support the development of 3D medical text-image retrieval systems, BIMCV-R aims to assist clinicians and researchers in conducting disease diagnosis and treatment planning more efficiently by providing abundant case resources.

提供机构：

中国科学技术大学, 帝国理工学院

创建时间：

2024-03-24

搜集汇总

数据集介绍

构建方式

在三维医学影像与文本检索领域，BIMCV-R数据集的构建体现了严谨的学术规范与临床实践的深度融合。该数据集以BIMCV医学影像库为基础，经过多阶段精细处理：首先对原始CT影像进行严格筛选，剔除像素缺失超过30%或任一维度小于96的图像，并手动选取高质量样本；随后，对西班牙语放射学报告进行匿名化处理，并利用GPT-4翻译为英文，再经人工校对确保语义准确性；最终，由超过20名医学专家对1475个样本进行诊断标注，涵盖96种疾病类型，形成包含8069个三维CT体素与对应报告的配对数据集，总数据量超过700GB。

特点

BIMCV-R数据集的核心特征在于其开创性的三维医学多模态架构。该数据集不仅提供高分辨率的三维CT体素（包含超过200万张切片），更首次实现了与真实放射学报告的规模化精准配对。其影像数据覆盖宽度、高度及切片数的广泛分布（如宽度514-710像素，切片数101-670层），配合平均长度104词的详细文本描述，构建了丰富的跨模态语义关联。尤为突出的是，数据集包含基于临床诊断构建的关键词库，涵盖肿瘤、心血管疾病等多类病理特征，为深度学习模型提供了从视觉特征到医学语义的立体化学习框架。

使用方法

该数据集为三维医学跨模态检索研究提供了标准化评估基准。研究者可基于其划分的训练集（70%）、验证集（10%）与测试集（20%）开展文本-图像双向检索任务：通过文本编码器（如BiomedCLIP）提取放射报告的语义特征，同时利用三维视觉编码器（如3D ViT或ResNet）学习CT体素的空间表征，再通过相似度匹配机制实现跨模态对齐。数据集支持的关键词检索功能，允许以特定疾病术语（如肺不张、淋巴结病）查询相关影像案例，为临床辅助诊断系统开发提供了实用化验证场景。配套提出的MedFinder双流检索框架，进一步展示了预训练语言模型与三维视觉特征融合的可行性路径。

背景与挑战

背景概述

随着三维医学影像技术在临床诊断中的广泛应用，医疗专业人员面临的数据处理负担日益加重。为辅助临床决策并提升工作效率，开发能够检索相似病例的智能系统成为关键研究方向。然而，三维医学影像与文本检索领域长期缺乏高质量、标准化的评估基准与数据集，制约了相关算法的进展。在此背景下，中国科学技术大学与伦敦帝国理工学院的研究团队于2024年推出了BIMCV-R数据集，该数据集基于BIMCV医学影像库构建，包含8,069个三维CT影像及其对应的放射学报告，覆盖96种疾病类型，旨在为三维医学多模态检索研究提供首个公开的英文基准资源，推动医学影像智能分析技术的发展。

当前挑战

在三维医学影像与文本检索领域，核心挑战在于如何精准建立高维视觉数据与复杂医学文本之间的语义关联，这要求模型不仅能理解三维空间中的解剖结构与病变特征，还需解析放射学报告中专业术语的细微差异。构建BIMCV-R数据集的过程中，研究团队面临多重困难：首先，原始数据包含大量低质量影像与文本缺失样本，需通过严格筛选与去噪处理确保数据一致性；其次，为保护患者隐私，所有放射学报告均需进行匿名化处理，并将西班牙语原文经GPT-4翻译为英文后由医学专家人工校验，以保障文本的准确性与专业性；此外，三维CT数据体积庞大（超过700GB），其存储、预处理与标注过程对计算资源与跨学科协作提出了极高要求。

常用场景

经典使用场景

在三维医学影像分析领域，BIMCV-R数据集为跨模态检索研究提供了关键基础设施。该数据集最经典的应用场景在于构建端到端的文本-图像检索系统，通过将放射学报告的自然语言描述与对应的三维CT体数据进行语义对齐，实现基于临床描述的病例检索。研究者利用其超过八千组精确配对的影像-报告数据，训练深度神经网络学习医学视觉特征与专业文本之间的复杂映射关系，为临床决策支持系统奠定数据基础。

实际应用

在实际临床工作流程中，BIMCV-R支撑的检索系统能够显著提升诊疗效率。放射科医师可通过输入自然语言描述的病症特征，快速检索出具有相似影像表现的既往病例，为鉴别诊断提供参考依据。系统支持的关键词检索功能，允许医师使用‘肺不张’、‘淋巴结肿大’等专业术语直接定位相关影像，这种基于内容的检索机制减少了人工翻阅大量影像档案的时间消耗，在肿瘤诊断、感染性疾病评估等场景中展现出重要应用价值。

衍生相关工作

基于BIMCV-R数据集衍生的经典工作包括其配套提出的MedFinder检索框架。该框架创新性地采用双流网络架构，融合大型语言模型BiomedCLIP的文本理解能力与三维视觉编码器的空间特征提取能力，实现了文本-图像、图像-文本及关键词检索的多任务统一。后续研究在此基础上发展了多种改进方法，如引入视图一致性约束增强特征鲁棒性、设计跨注意力机制融合多视角信息等，这些工作共同推动了三维医学多模态检索技术体系的形成与发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集