MedQ-DEG-Bench
收藏MedQ-DEG-Bench 数据集概述
数据集简介
MedQ-DEG-Bench 是一个用于评估医学视觉语言模型在图像质量退化情况下鲁棒性的综合性基准。该基准旨在系统性地衡量现实临床场景中因设备限制、患者运动或采集伪影导致的图像质量退化对视觉语言模型诊断性能的影响。
关键特征
- 系统性退化模拟:涵盖7种医学成像模态下的18种临床相关退化类型。
- 多严重程度评估:每种退化均应用了轻度与重度两个严重级别,以量化鲁棒性梯度。
- 大规模基准:包含24,894个样本,涵盖退化图像和干净的参考图像。
- 多源聚合:样本来源于3个已建立的医学视觉问答数据集。
- 即插即用评估:与VLMEvalKit集成,支持无缝模型评估。
数据集构成
| 数据划分 | 样本数量 | 描述 |
|---|---|---|
MedQDEGBench_simulate_dev |
10,392 | 退化图像 - 开发集 |
MedQDEGBench_simulate_test |
10,196 | 退化图像 - 测试集 |
MedQDEGBench_good_dev |
2,153 | 干净参考图像 - 开发集 |
MedQDEGBench_good_test |
2,153 | 干净参考图像 - 测试集 |
医学成像模态
| 模态 | 描述 |
|---|---|
| CT | 计算机断层扫描 |
| MRI | 磁共振成像 |
| X-ray | X射线摄影 |
| Ultrasound | 超声成像 |
| Endoscopy | 内窥镜成像 |
| Dermoscopy | 皮肤镜成像 |
| Histopathology | 组织病理学成像 |
退化类型
模拟了5个类别下的18种临床相关退化类型,每种退化均应用了轻度和重度两个严重级别。
伪影 (7种类型,模态特定)
| 退化类型 | 模态 | 描述 |
|---|---|---|
| 有限角度重建 | CT | 角度采样不完整,产生条纹和阴影伪影 |
| 稀疏视图重建 | CT | 正弦图测量子采样,导致环形伪影和分辨率损失 |
| 偏置场伪影 | MRI | 平滑、空间变化的强度不均匀性,模拟B1场非均匀性 |
| 欠采样伪影 | MRI | 加速k空间采集导致混叠和重影 |
| 重影伪影 | MRI | 周期性运动引起的沿相位编码方向的吉布斯振铃 |
| 血细胞伪影 | Histopathology | 红细胞样圆形遮挡,模拟出血污染 |
| 暗点伪影 | Histopathology | 不规则形状的暗区,模拟气泡或染色沉淀物 |
运动干扰 (2种类型,通用)
| 退化类型 | 描述 |
|---|---|
| 物体旋转 | 平面内仿射旋转,模拟患者重新定位或机架未对准 |
| 物体移动 | 随机平面内平移,模拟患者位移 |
强度抖动 (3种类型,通用)
| 退化类型 | 描述 |
|---|---|
| 亮度调整 | 均匀像素强度偏移,模拟曝光过度或不足 |
| 曝光变化 | 非线性伽马校正,模拟传感器增益变化 |
| 对比度降低 | 动态范围压缩,模拟次优的窗宽/窗位设置 |
噪声 (2种类型)
| 退化类型 | 模态 | 描述 |
|---|---|---|
| 高斯噪声 | 通用 | 零均值各向同性高斯噪声,模拟热探测器噪声 |
| 低剂量噪声 | CT | 应用于正弦图域的泊松噪声模型,模拟剂量降低的采集 |
分辨率与模糊 (4种类型)
| 退化类型 | 模态 | 描述 |
|---|---|---|
| 低分辨率 | 通用 | 下采样和上采样,模拟降低的空间分辨率 |
| 运动模糊 | 通用 | 方向性卷积核,模拟相机或患者运动 |
| 高斯模糊 | 通用 | 各向同性高斯低通滤波器,模拟光学散焦 |
| 气泡 | Histopathology | 半透明圆形区域,模拟盖玻片下的气泡 |
评估指标
基准提供多维度的准确性分析:
- 总体准确性:所有样本的聚合性能。
- 按模态:跨7种医学成像模态的性能细分。
- 按退化类型:18种退化类型各自的准确性。
- 按严重级别:轻度、重度和干净条件之间的比较。
- 按源数据集:不同来源医学视觉问答数据集的性能。
- 按能力:不同医学能力维度(例如,高级和中级能力)的性能。
数据访问
MedQ-DEG-Bench 数据集可通过 Hugging Face 获取:https://huggingface.co/datasets/jiyaoliufd/MedQ-DEG-Bench
相关项目
- MedQ-Bench:评估MLLMs中的医学图像质量评估能力。项目地址:https://github.com/liujiyaoFDU/MedQ-Bench
- VLMEvalKit:视觉语言模型的综合评估工具包。项目地址:https://github.com/open-compass/VLMEvalKit/tree/lite
引用
如果研究中使用 MedQ-DEG-Bench,请引用论文: bibtex @article{liu2026medq, title={MedQ-Deg: A Multidimensional Benchmark for Evaluating MLLMs Across Medical Image Quality Degradations}, author={Jiyao Liu and Junzhi Ning and Chenglong Ma and Wanying Qu and Jianghan Shen and Siqi Luo and Jinjie Wei and Jin Ye and Pengze Li and Tianbin Li and Jiashi Lin and Hongming Shan and Xinzhe Luo and Xiaohong Liu and Lihao Liu and Junjun He and Ningsheng Xu}, journal={arXiv preprint arXiv:2603.07769}, year={2026} }
许可证
本项目采用 Apache License 2.0 许可证。




