MedSeg-TTA
收藏github2025-11-26 更新2025-11-30 收录
下载链接:
https://github.com/wenjing-gg/MedSeg-TTA
下载链接
链接失效反馈官方服务:
资源简介:
MedSeg-TTA是一个用于医学图像分割测试时间适应评估的大规模基准数据集,覆盖肿瘤、器官和病变分割,涵盖七种成像模态(MRI、CT、US、PATH、DER、OCT、CXR)。数据集采用标准化预处理和分区,真实反映跨机构、扫描仪和人群的分布偏移,为统一的TTA基准提供数据基础。
MedSeg-TTA is a large-scale benchmark dataset for evaluating test-time adaptation in medical image segmentation. It covers tumor, organ and lesion segmentation tasks, and encompasses seven imaging modalities: MRI, CT, US, PATH, DER, OCT and CXR. The dataset adopts standardized preprocessing and partitioning, faithfully reflects distribution shifts across institutions, scanners and populations, and provides a data foundation for unified TTA benchmarking.
创建时间:
2025-11-08
原始信息汇总
MedSeg-TTA 数据集概述
数据集简介
MedSeg-TTA 是一个用于医学图像分割测试时适应方法评估的开放基准。该基准通过标准化数据、指标和协议,支持跨模态、器官和任务的公平可重复比较。
主要特点
- 多模态覆盖:涵盖7种成像模态(MRI、CT、US、PATH、DER、OCT、CXR)
- 严格约束:固定骨干网络、禁止源域访问、无隐式泄漏
- 标准化评估:使用Dice和HD95等区域一致性和结构敏感指标
数据集构成
源域-目标域数据对
MRI模态
- 源域:BraTS-GLI2024(4分类,1k-2k样本,2024年)
- 目标域:BraTS-SSA(4分类,60样本,2023年)
CT模态
- 源域:LiTS(二分类,<0.5k样本,2017年,已重处理)
- 目标域:3D-IRCADB(二分类,20样本,2010年,已重处理)
皮肤镜模态
- 源域:ISIC-2017(二分类,2k-3k样本,2017年)
- 目标域:PH²(二分类,<0.5k样本,2015年)
超声模态
- 源域:TN3K(二分类,2k-3k样本,2021年)
- 目标域:DDTI(二分类,0.5k-1k样本,2015年)
X射线模态
- 源域:SZ-CXR(二分类,0.5k-1k样本,2018年)
- 目标域:Montgomery(二分类,<0.5k样本,2021年)
眼底模态
- 源域:RIGA+ (MES)(二分类,<0.5k样本,2021年,已重处理)
- 目标域:RIGA+ (MB)(二分类,<0.5k样本,2021年,已重处理)
组织病理学模态
- 源域:CRAG(二分类,<0.5k样本,2019年,已重处理)
- 目标域:Glas(二分类,<0.5k样本,2017年,已重处理)
任务类型
- 二分类任务:前景-背景分割
- 4分类任务:背景加三个解剖学类别
获取方式
各数据集的下载链接详见源域-目标域数据对表格中的Source列。
引用格式
bibtex @article{MedSeg-TTA, title = {MedSeg-TTA: Benchmarking Test-time Adaptation Methods for Domain Shift in Medical Image Segmentation}, journal = {arXiv preprint arXiv:xxxx.xxxxx}, year = {2025} }
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,MedSeg-TTA数据集通过整合七种不同成像模态的数据构建而成,包括磁共振成像、计算机断层扫描、超声、病理切片、皮肤镜、光学相干断层扫描和X射线影像。该数据集采用标准化的预处理流程,严格划分源域与目标域数据对,确保数据分布差异真实反映医疗机构、扫描设备和人群特征的变异。每个数据对均经过类别定义对齐处理,部分数据经过重处理以消除技术差异,从而为测试时自适应研究提供可靠的数据基础。
特点
该数据集涵盖肿瘤、器官和病灶分割任务,具有多模态与多中心的显著特性。其设计遵循严格的测试时自适应约束条件,包括固定骨干网络架构、禁止源域数据访问以及杜绝任何形式的隐式信息泄露。数据集通过引入区域一致性指标与结构敏感度量标准,如Dice系数和豪斯多夫距离,支持跨模态、跨器官的公平性能比较,为医学图像分割的域适应研究建立了标准化评估体系。
使用方法
研究人员可通过GitHub仓库获取标准化的数据划分与预处理流程,使用统一的评估协议进行模型验证。数据集支持四种测试时自适应范式的性能对比,提供可复现的基线模型配置与评估脚本。用户需按照既定格式提交预测结果,通过公开排行榜实现跨模态性能追踪。该框架确保所有方法在同等条件下进行验证,推动医学图像分割领域测试时自适应研究的可重复性与可比性。
背景与挑战
背景概述
医学影像分割领域长期面临域偏移问题的严峻挑战,不同医疗机构采集设备、成像参数及患者群体的差异导致模型泛化能力显著下降。MedSeg-TTA基准数据集于2025年由研究团队系统构建,覆盖磁共振成像、计算机断层扫描等七种影像模态,整合了来自BraTS-GLI2024、LiTS等十余个权威数据源的标注数据。该数据集通过标准化预处理流程与严格划分的源域-目标域配对,为测试时自适应方法提供了跨机构、跨设备的统一评估框架,显著推进了医学影像分析在临床实践中的鲁棒性研究。
当前挑战
在医学影像分割领域,域偏移现象导致模型在未知分布数据上性能急剧退化,具体表现为不同扫描仪厂商的成像差异、病变形态的多变性以及标注标准的不一致性。数据集构建过程中需克服多中心数据异构性挑战,包括模态间灰度分布差异、病灶尺度悬殊以及部分数据标注粒度不匹配等问题。此外,在严格遵循测试时自适应协议的前提下,还需确保源域数据完全隔离,避免任何形式的隐式信息泄露,这对数据预处理流程设计与评估标准制定提出了极高要求。
常用场景
经典使用场景
在医学影像分割领域,域偏移问题常导致模型在临床部署时性能下降。MedSeg-TTA通过构建多模态、多中心的标准化数据集,为测试时自适应方法提供了统一评估框架。该数据集覆盖MRI、CT等七种成像模态,支持肿瘤、器官和病变分割任务,使研究者能够在严格约束下系统验证TTA方法的泛化能力。
衍生相关工作
基于该基准的范式分类体系,研究者系统比较了二十种前沿TTA方法,形成了方法适用性谱系图。这些工作揭示了不同模态下熵最小化、批归一化统计量调整等范式的有效性边界,催生了面向特定医学影像特性的新型自适应算法,为后续研究提供了理论指导与实践范本。
数据集最近研究
最新研究方向
在医学影像分割领域,域偏移问题长期制约着模型在临床实践中的泛化能力。MedSeg-TTA基准通过整合七种成像模态的多中心数据,系统构建了测试时适应方法的评估框架,其前沿研究聚焦于无源域访问约束下的动态参数优化与特征对齐机制。当前热点探索方向涵盖对抗性扰动防御、流形正则化策略以及基于解剖结构一致性的自监督范式,这些研究显著提升了模型面对扫描设备差异和人群分布变异时的鲁棒性。该基准建立的范式分类体系与跨模态评估标准,不仅为医学人工智能的可信部署提供了关键理论支撑,更推动了联邦学习与边缘计算在智慧医疗场景中的深度融合。
以上内容由遇见数据集搜集并总结生成



