NOVA

Name: NOVA
Creator: 慕尼黑工业大学, 伊萨尔河右岸医院, 慕尼黑亥姆霍兹中心, 埃尔朗根-纽伦堡弗劳恩霍夫应用大学, 伦敦帝国学院, 伦敦国王学院
Published: 2025-05-20 16:10:57
License: 暂无描述

arXiv2025-05-20 更新2025-05-22 收录

下载链接：

https://huggingface.co/datasets/Ano-2090/Nova

下载链接

链接失效反馈

官方服务：

资源简介：

NOVA是一个包含约900个脑部MRI扫描的数据集，涵盖了281种罕见的病理学和异构采集协议。每个案例都包含丰富的临床叙事和双盲专家边界框注释。这些数据集旨在评估异常定位、视觉描述和诊断推理的能力。由于NOVA从未用于训练，因此它成为了一个极端的压力测试，用于评估模型在样本外观和语义空间中的分布外泛化能力。

NOVA is a dataset comprising approximately 900 brain MRI scans, encompassing 281 rare pathologies and heterogeneous acquisition protocols. Each case in the dataset includes rich clinical narratives and double-blinded expert bounding box annotations. This dataset is designed to evaluate model capabilities in anomaly localization, visual description and diagnostic reasoning. As NOVA has never been used for model training, it serves as an extreme stress test for assessing the out-of-distribution generalization capabilities of models across both sample appearance and semantic spaces.

提供机构：

慕尼黑工业大学, 伊萨尔河右岸医院, 慕尼黑亥姆霍兹中心, 埃尔朗根-纽伦堡弗劳恩霍夫应用大学, 伦敦帝国学院, 伦敦国王学院

创建时间：

2025-05-20

搜集汇总

数据集介绍

构建方式

NOVA数据集构建于Eurorad平台上的906例脑部MRI扫描，涵盖281种罕见病理学类型，采用严格的筛选标准确保数据质量和多样性。所有病例均保留原始成像参数和临床异质性，未进行预处理以维持真实临床场景的复杂性。数据标注由8名神经放射科住院医师独立完成，并通过资深神经放射科医师的仲裁确保标注一致性，最终形成包含异常定位边界框、临床病史和影像描述的综合性标注体系。

特点

该数据集具有三大核心特征：临床极端异质性（包含轴向/矢状/冠状位的T1/T2/FLAIR序列）、长尾病理分布（281种诊断类别呈幂律分布）以及多模态标注体系（整合边界框定位、影像描述和诊断推理）。其独特价值在于首次实现开放世界评估场景，要求模型在零样本条件下处理真实临床中未曾见过的罕见病症，突破了传统封闭集评估的局限性。

使用方法

NOVA设计为纯评估基准，提供三种递进式任务框架：异常定位（mAP@IoU指标）、影像描述（关键词F1/BLEU指标）和诊断推理（Top-k准确率）。使用者需直接加载Hugging Face发布的PNG格式影像与CSV标注文件，在禁止微调的前提下测试模型对未见病例的泛化能力。基准测试特别强调模型在视觉-语义双重分布偏移下的表现，需同步输出定位框、影像描述和诊断结论以完成端到端评估。

背景与挑战

背景概述

NOVA数据集由慕尼黑工业大学、伦敦帝国理工学院等多家知名机构的研究团队于2025年联合推出，旨在解决医学影像领域分布外泛化的核心挑战。作为专注于脑部MRI异常定位与临床推理的评估基准，该数据集包含906例涵盖281种罕见病理的脑部MRI扫描，每例均配有临床病史叙述和双盲专家标注的边界框。其创新性在于首次实现了异常定位、视觉描述和诊断推理的联合评估，为医学影像分析领域建立了开放世界检测的新范式。数据集采用严格的评估专用设计，迫使模型在零样本条件下应对真实临床场景中的视觉与语义分布偏移，对推动医疗AI在未知病理检测方面的发展具有里程碑意义。

当前挑战

NOVA数据集面临的核心挑战体现在两个维度：在领域问题层面，需解决脑部MRI中罕见病理的开放集检测难题，要求模型突破传统封闭集评估的局限，应对281种低频率异常类型的视觉特征变异和语义鸿沟；在构建过程中，研究团队需克服医学数据特有的标注复杂性，通过多阶段放射科医师标注协议解决临床异常定位的主观性问题，同时保持原始影像的协议异质性以反映真实世界场景。数据的长尾分布特性（部分病理仅有个位数样本）与严格的评估专用设计，进一步增加了建立可靠基准的难度。现有视觉语言模型在该数据集上表现出的性能骤降（如异常定位mAP@50仅7.37%-24.49%），凸显了医疗开放集识别这一关键瓶颈问题。

常用场景

经典使用场景

NOVA数据集在医学影像分析领域中被广泛用于评估模型在极端临床异质性下的泛化能力。该数据集包含约900例脑部MRI扫描，涵盖281种罕见病理学类型，为研究者提供了一个真实且具有挑战性的测试平台。通过结合放射科医师提供的边界框标注和临床叙述，NOVA能够全面评估模型在异常定位、图像描述和诊断推理方面的表现。

衍生相关工作

NOVA数据集已经催生了一系列关于医学异常检测和开放集识别的研究工作。基于该数据集，研究者开发了多种先进的视觉语言模型，如GPT-4o、Gemini 2.0 Flash和Qwen2.5-VL-72B，这些模型在异常定位和临床推理任务中展现了不同的性能特点，为后续研究提供了重要参考。

数据集最近研究