MieDB-100k

github2026-02-11 更新2026-02-13 收录

下载链接：

https://github.com/Raiiyf/MieDB-100k

下载链接

链接失效反馈

官方服务：

资源简介：

MieDB-100k是一个大规模、高质量且多样化的文本引导医学图像编辑数据集。它通过特定模态的专家模型和基于规则的数据合成方法构建，并经过严格的人工检查以确保临床保真度。

MieDB-100k is a large-scale, high-quality, and diverse text-guided medical image editing dataset. It is constructed using modal-specific expert models and rule-based data synthesis methods, and has undergone rigorous manual inspection to ensure clinical fidelity.

创建时间：

2026-01-31

原始信息汇总

MieDB-100k 数据集概述

数据集基本信息

数据集名称：MieDB-100k
核心描述：一个用于文本引导医学图像编辑的大规模、高质量、多样化数据集。
构建方法：通过特定模态的专家模型和基于规则的数据合成方法构建，并经过严格的人工检查以确保临床保真度。

数据集内容与结构

数据规模：100k（十万级别）
数据划分：包含训练集（train split）和基准测试集（benchmark split）。
主要文件：
- metadata.json：元数据文件。
- input：输入图像目录。
- output：输出图像目录。

获取与设置

下载地址：https://huggingface.co/datasets/Laiyf/MieDB-100k
下载脚本：使用 dataset_download.py 脚本。
环境要求：Python 3.11，依赖包见 requirements.txt。

评估与基准

评估脚本：提供用于在基准模型上运行推理和评估的脚本。
评估指标：
- DICE 和感知准确度（Perception Accuracy）。
- 感知视角下的背景 PSNR 和 SSIM。
- 修改视角（Modification perspective）评估。
- 变换视角（Transformation perspective）评估。
模型训练：提供在 MieDB-100k 上微调 OmniGen2 的脚本。

相关资源

论文地址：https://arxiv.org/abs/2602.09587
引用格式：

@article{miedb100k, title={MieDB-100k: A Comprehensive Dataset for Medical Image Editing}, author={Yongfan Lai and Wen Qian and Bo Liu and Hongyan Li and Hao Luo and Fan Wang and Bohan Zhuang and Shenda Hong}, year={2026}, journel={Preprint at Arxiv} url={https://arxiv.org/abs/2602.09587}, }

搜集汇总

数据集介绍

构建方式

在医学影像编辑领域，数据集的构建需兼顾专业性与多样性。MieDB-100k通过结合特定模态的专家模型与基于规则的数据合成方法，系统性地生成大规模文本引导的医学影像编辑样本。为确保临床保真度，所有生成数据均经过严格的人工审查，从而形成高质量且覆盖广泛医学场景的数据资源。

特点

该数据集以其大规模、高质量及多样性著称，囊括了丰富的医学影像编辑任务，涵盖不同模态与病理状态。其独特之处在于通过专家模型与规则合成相结合的方式，保证了数据在临床上的可信度，同时提供了清晰的输入-输出配对，为模型训练与评估奠定了坚实基础。

使用方法

用户可通过提供的脚本便捷下载数据集，并按照基准划分与训练划分进行组织。数据集支持多种评估指标的计算，包括DICE、感知准确性、背景PSNR与SSIM等，用户可依据需求调整评估对象。此外，还提供了在OmniGen2模型上进行微调的完整流程，便于开展深入的医学影像编辑研究。

背景与挑战

背景概述

在医学影像分析领域，文本引导的医学图像编辑技术正逐渐成为研究热点，其旨在通过自然语言指令实现对医学图像的精准修改，以辅助临床诊断、教学与科研。MieDB-100k数据集于2026年由相关研究团队构建，作为一个大规模、高质量且多样化的医学图像编辑数据集，它通过结合模态特异性专家模型与基于规则的数据合成方法，并辅以严格的人工检查，确保了数据的临床保真度。该数据集的发布为医学图像生成与编辑模型的训练与评估提供了关键资源，推动了跨模态医学人工智能的发展，对提升医疗影像的智能化处理水平具有显著影响力。

当前挑战

MieDB-100k数据集致力于解决文本引导医学图像编辑领域的核心挑战，即如何实现基于自然语言描述的医学图像精准、可控且符合临床实际的编辑。这一任务面临多重困难：医学图像通常具有复杂的解剖结构和病理特征，编辑过程需保持生物学合理性与诊断相关性；同时，文本指令与图像内容之间的语义对齐要求极高，以避免误导性修改。在数据集构建过程中，挑战同样突出：生成高质量、多样化的编辑样本需要融合多模态专家知识，确保合成数据的真实性与有效性；此外，大规模数据的人工检查成本高昂，且需依赖领域专家以维持临床标准，这些因素共同构成了数据集开发与应用中的主要障碍。

常用场景

经典使用场景

在医学影像分析领域，MieDB-100k数据集为文本引导的医学图像编辑任务提供了关键支持。该数据集通过专家模型与规则合成方法构建，并经过严格人工审核，确保了临床保真度。其经典使用场景集中于训练和评估生成模型，如扩散模型或Transformer架构，以实现基于自然语言描述的医学图像修改，例如在CT或MRI影像中模拟病变添加、组织移除或模态转换，从而推动智能辅助诊断系统的研发。

衍生相关工作

围绕MieDB-100k数据集，已衍生出多项经典研究工作，特别是基于OmniGen2等先进模型的微调与优化。这些工作专注于提升医学图像编辑的精度与可控性，例如通过引入感知评估指标如DICE和PSNR-SSIM，来量化编辑效果的结构相似性与视觉质量。相关研究还探索了多视角评估框架，结合视觉语言模型进行语义一致性分析，进一步推动了医学人工智能在编辑任务中的标准化与实用化进程。

数据集最近研究