MedSeg-TTA

github2025-11-26 更新2025-11-30 收录

下载链接：

https://github.com/wenjing-gg/MedSeg-TTA

下载链接

链接失效反馈

官方服务：

资源简介：

MedSeg-TTA是一个用于医学图像分割测试时间适应评估的大规模基准数据集，覆盖肿瘤、器官和病变分割，涵盖七种成像模态（MRI、CT、US、PATH、DER、OCT、CXR）。数据集采用标准化预处理和分区，真实反映跨机构、扫描仪和人群的分布偏移，为统一的TTA基准提供数据基础。

MedSeg-TTA is a large-scale benchmark dataset for evaluating test-time adaptation in medical image segmentation. It covers tumor, organ and lesion segmentation tasks, and encompasses seven imaging modalities: MRI, CT, US, PATH, DER, OCT and CXR. The dataset adopts standardized preprocessing and partitioning, faithfully reflects distribution shifts across institutions, scanners and populations, and provides a data foundation for unified TTA benchmarking.

创建时间：

2025-11-08

原始信息汇总

MedSeg-TTA 数据集概述

数据集简介

MedSeg-TTA 是一个用于医学图像分割测试时适应方法评估的开放基准。该基准通过标准化数据、指标和协议，支持跨模态、器官和任务的公平可重复比较。

主要特点

多模态覆盖：涵盖7种成像模态（MRI、CT、US、PATH、DER、OCT、CXR）
严格约束：固定骨干网络、禁止源域访问、无隐式泄漏
标准化评估：使用Dice和HD95等区域一致性和结构敏感指标

数据集构成

源域-目标域数据对

MRI模态

源域：BraTS-GLI2024（4分类，1k-2k样本，2024年）
目标域：BraTS-SSA（4分类，60样本，2023年）

CT模态

源域：LiTS（二分类，<0.5k样本，2017年，已重处理）
目标域：3D-IRCADB（二分类，20样本，2010年，已重处理）

皮肤镜模态

源域：ISIC-2017（二分类，2k-3k样本，2017年）
目标域：PH²（二分类，<0.5k样本，2015年）

超声模态

源域：TN3K（二分类，2k-3k样本，2021年）
目标域：DDTI（二分类，0.5k-1k样本，2015年）

X射线模态

源域：SZ-CXR（二分类，0.5k-1k样本，2018年）
目标域：Montgomery（二分类，<0.5k样本，2021年）

眼底模态

源域：RIGA+ (MES)（二分类，<0.5k样本，2021年，已重处理）
目标域：RIGA+ (MB)（二分类，<0.5k样本，2021年，已重处理）

组织病理学模态

源域：CRAG（二分类，<0.5k样本，2019年，已重处理）
目标域：Glas（二分类，<0.5k样本，2017年，已重处理）

任务类型

二分类任务：前景-背景分割
4分类任务：背景加三个解剖学类别

获取方式

各数据集的下载链接详见源域-目标域数据对表格中的Source列。

引用格式

bibtex @article{MedSeg-TTA, title = {MedSeg-TTA: Benchmarking Test-time Adaptation Methods for Domain Shift in Medical Image Segmentation}, journal = {arXiv preprint arXiv:xxxx.xxxxx}, year = {2025} }

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，MedSeg-TTA数据集通过整合七种不同成像模态的数据构建而成，包括磁共振成像、计算机断层扫描、超声、病理切片、皮肤镜、光学相干断层扫描和X射线影像。该数据集采用标准化的预处理流程，严格划分源域与目标域数据对，确保数据分布差异真实反映医疗机构、扫描设备和人群特征的变异。每个数据对均经过类别定义对齐处理，部分数据经过重处理以消除技术差异，从而为测试时自适应研究提供可靠的数据基础。

特点

该数据集涵盖肿瘤、器官和病灶分割任务，具有多模态与多中心的显著特性。其设计遵循严格的测试时自适应约束条件，包括固定骨干网络架构、禁止源域数据访问以及杜绝任何形式的隐式信息泄露。数据集通过引入区域一致性指标与结构敏感度量标准，如Dice系数和豪斯多夫距离，支持跨模态、跨器官的公平性能比较，为医学图像分割的域适应研究建立了标准化评估体系。

使用方法

研究人员可通过GitHub仓库获取标准化的数据划分与预处理流程，使用统一的评估协议进行模型验证。数据集支持四种测试时自适应范式的性能对比，提供可复现的基线模型配置与评估脚本。用户需按照既定格式提交预测结果，通过公开排行榜实现跨模态性能追踪。该框架确保所有方法在同等条件下进行验证，推动医学图像分割领域测试时自适应研究的可重复性与可比性。

背景与挑战

背景概述

医学影像分割领域长期面临域偏移问题的严峻挑战，不同医疗机构采集设备、成像参数及患者群体的差异导致模型泛化能力显著下降。MedSeg-TTA基准数据集于2025年由研究团队系统构建，覆盖磁共振成像、计算机断层扫描等七种影像模态，整合了来自BraTS-GLI2024、LiTS等十余个权威数据源的标注数据。该数据集通过标准化预处理流程与严格划分的源域-目标域配对，为测试时自适应方法提供了跨机构、跨设备的统一评估框架，显著推进了医学影像分析在临床实践中的鲁棒性研究。

当前挑战

在医学影像分割领域，域偏移现象导致模型在未知分布数据上性能急剧退化，具体表现为不同扫描仪厂商的成像差异、病变形态的多变性以及标注标准的不一致性。数据集构建过程中需克服多中心数据异构性挑战，包括模态间灰度分布差异、病灶尺度悬殊以及部分数据标注粒度不匹配等问题。此外，在严格遵循测试时自适应协议的前提下，还需确保源域数据完全隔离，避免任何形式的隐式信息泄露，这对数据预处理流程设计与评估标准制定提出了极高要求。

常用场景

经典使用场景

在医学影像分割领域，域偏移问题常导致模型在临床部署时性能下降。MedSeg-TTA通过构建多模态、多中心的标准化数据集，为测试时自适应方法提供了统一评估框架。该数据集覆盖MRI、CT等七种成像模态，支持肿瘤、器官和病变分割任务，使研究者能够在严格约束下系统验证TTA方法的泛化能力。

衍生相关工作

基于该基准的范式分类体系，研究者系统比较了二十种前沿TTA方法，形成了方法适用性谱系图。这些工作揭示了不同模态下熵最小化、批归一化统计量调整等范式的有效性边界，催生了面向特定医学影像特性的新型自适应算法，为后续研究提供了理论指导与实践范本。

数据集最近研究