MedForge-90K

github2026-04-08 更新2026-04-10 收录

下载链接：

https://github.com/richardChenzhihui/ACL2026-MedForge

下载链接

链接失效反馈

官方服务：

资源简介：

MedForge-90K包含：- 30K真实图像（CXR、脑部MRI、眼底）- 30K病变植入伪造- 30K病变去除伪造。注意：此仓库中的`data/`目录目前仅包含示例数据。每个伪造设置包括10个样本用于演示目的。完整的MedForge-90K数据集将单独提供。

MedForge-90K consists of: - 30K real images (CXR, brain MRI, fundus images) - 30K forgeries with artificially implanted lesions - 30K forgeries with lesions removed Note that the `data/` directory in this repository currently only contains sample data, with 10 samples per forgery setting for demonstration purposes. The full MedForge-90K dataset will be provided separately.

创建时间：

2026-04-08

原始信息汇总

MedForge数据集概述

数据集基本信息

数据集名称：MedForge-90K
核心用途：用于可解释的医学深度伪造检测，支持基于伪造感知推理的模型训练与评估。
论文链接：https://arxiv.org/abs/2603.18577

数据集构成

MedForge-90K是一个大规模医学图像伪造检测基准数据集，具体包含以下内容：

真实图像：30,000张（涵盖胸部X光、脑部MRI、眼底图像）。
病灶植入伪造图像：30,000张。
病灶移除伪造图像：30,000张。

重要说明：本代码仓库的data/目录仅包含用于演示的样本数据，每种伪造场景各提供10个样本。完整的MedForge-90K数据集将另行发布。

数据标注与格式

数据集采用专家引导的推理监督，提供了结构化的思维链（Chain-of-Thought, CoT）标注示例。标注格式包含以下关键元素：

图像描述：对医学图像模态和内容的描述。
可疑区域定位：使用边界框坐标（x1, y1, x2, y2）标识疑似伪造区域。
证据分析：对可疑区域进行详细的医学解剖学异常描述。
结论：基于证据得出图像是否为深度伪造的最终判断。

详细的标注指南和样本可在代码仓库的data/和dataset_tools/文件夹中找到。

数据集应用

该数据集主要用于支持以下研究任务：

医学深度伪造检测：分类图像为真实或伪造。
伪造区域定位：预测图像中的可疑伪造区域。
可解释性推理生成：生成基于医学证据的推理过程（思维链）。

相关工具与脚本

代码仓库提供了与数据集配套使用的工具和评估脚本，位于以下目录：

dataset_tools/：包含用于生成高保真伪造图像和专家引导标注的工具。
evaluation/：包含检测评估（计算准确率、F1分数、mIoU）和可解释性评估（基于LLM的推理质量评判）的脚本。

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，数据集的构建质量直接关系到模型的可信度与泛化能力。MedForge-90K数据集的构建采用了系统化的生成与标注流程，首先基于真实的医学影像（包括胸部X光、脑部MRI和眼底图像）创建了30,000张原始图像。随后，通过先进的文本引导图像编辑技术，生成了30,000张病灶植入伪造图像和30,000张病灶移除伪造图像，确保了伪造样本的高保真度与临床合理性。每张伪造图像均配备了由医学专家指导的结构化思维链注释，这些注释不仅包含可疑区域的边界框定位，还提供了详细的证据分析与结论推理，为模型训练提供了丰富的监督信号。

使用方法

在医学影像安全研究中，数据集的有效利用是推动技术进展的关键。MedForge-90K数据集主要用于训练和评估医学深度伪造检测模型，特别是基于推理的检测方法。用户可通过监督微调（SFT）和伪造感知GSPO训练策略，利用数据集中的图像与思维链注释进行模型优化，强化模型的定位与推理能力。评估阶段则分为检测性能与可解释性两部分，前者通过准确率、F1分数和mIoU等指标衡量分类与定位精度，后者采用LLM-as-judge方法评估生成推理的逻辑性与证据基础，确保模型在临床环境中具备可信的决策支持能力。

背景与挑战

背景概述

随着文本引导图像编辑技术的飞速发展，高保真医学影像篡改对临床信任与安全构成严峻威胁。为应对这一挑战，研究团队于2026年提出了MedForge-90K数据集，旨在构建一个大规模、具有专家推理监督的医学深度伪造检测基准。该数据集由九万张图像构成，涵盖真实影像及病灶植入与移除两类伪造样本，涉及胸部X光、脑部MRI与眼底图像等多种模态。其核心研究问题聚焦于实现可解释的医学伪造检测，通过局部化-分析推理机制，引导模型先定位可疑区域再给出判断，从而增强检测过程的可信度与可追溯性。该数据集的建立为医学影像安全领域提供了重要的实证基础，推动了伪造检测从黑箱决策向证据驱动范式的转变。

当前挑战

在医学深度伪造检测领域，主要挑战在于区分高保真篡改与真实病理变异，这要求模型具备精细的解剖学与病理学知识。MedForge-90K致力于解决伪造检测与可解释性推理的双重问题，其构建过程面临多重困难：一是生成逼真的病灶编辑样本需保持影像的模态特性与解剖一致性，避免引入低级伪影；二是获取专家级别的推理标注成本高昂，需要放射科医生等专业人士对伪造区域进行精细描述与边界框标注；三是确保数据集的多样性与平衡性，涵盖不同解剖部位、疾病类型与篡改手法，以提升模型的泛化能力与临床实用性。

常用场景

经典使用场景

在医学影像分析领域，MedForge-90K数据集被广泛应用于深度伪造检测模型的训练与评估。该数据集通过提供大规模的真实医学影像与经过专业编辑的伪造样本，为研究者构建了一个高度仿真的测试环境。经典使用场景包括训练模型进行病灶植入与移除的伪造识别，并借助专家指导的推理监督，推动模型实现从可疑区域定位到详细分析的端到端检测流程，从而在医学影像安全领域建立起可靠的基准。

解决学术问题

MedForge-90K数据集主要解决了医学影像深度伪造检测中缺乏大规模、高质量标注数据的关键问题。其通过提供九万张涵盖胸部X光、脑部MRI及眼底图像的真实与伪造样本，并辅以结构化的思维链注释，有效支持了模型在分类准确性与可解释性方面的联合优化。该数据集的意义在于推动了医学影像伪造检测从单纯二分类任务向证据驱动的推理范式转变，为临床信任与安全提供了重要的学术支撑。

实际应用

在实际医疗场景中，MedForge-90K数据集的应用主要体现在提升医学影像系统的安全性与可信度。例如，在远程诊断与医疗影像共享平台中，基于该数据集训练的检测模型能够自动筛查经过恶意篡改的影像，防止伪造病灶或移除关键病征的图像误导临床决策。此外，其可解释的推理输出有助于医生快速理解模型的判断依据，从而在辅助诊断过程中增强人机协作的透明度与可靠性。

数据集最近研究