T-SYNTH
收藏github2025-07-08 更新2025-07-18 收录
下载链接:
https://github.com/DIDSR/tsynth-release
下载链接
链接失效反馈官方服务:
资源简介:
T-SYNTH是一个基于知识的合成乳腺图像数据集,包含配对DM(2D成像)和DBT(3D成像)图像,具有多种乳腺组织的像素级分割和边界框。
T-SYNTH is a knowledge-based synthetic breast imaging dataset containing paired DM (2D imaging) and DBT (3D imaging) images, with pixel-level segmentations and bounding boxes for multiple breast tissue types.
创建时间:
2025-06-29
原始信息汇总
T-SYNTH: 基于知识的合成乳腺图像数据集
数据集概述
- 名称:T-SYNTH
- 类型:合成乳腺图像数据集
- 内容:配对的DM(2D成像)和DBT(3D成像)图像
- 特点:包含各种乳腺组织的像素级分割和边界框标注
数据集贡献
- 提供公开的合成数据集,源自基于知识的模型
- 支持亚组分析,展示在不同乳腺密度下病变检测的性能差异
- 验证了在有限患者数据训练时,使用T-SYNTH进行数据增强可提升模型性能
数据集应用
- 用于训练病变检测模型(如Faster-RCNN)
- 支持DM和DBT(C-View)两种成像模式的研究
- 可用于数据增强以提高模型性能
相关资源
- Huggingface数据仓库:https://huggingface.co/datasets/didsr/tsynth
- 论文链接:https://arxiv.org/abs/2507.04038
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,合成数据正逐渐成为解决真实数据稀缺问题的有效途径。T-SYNTH数据集通过知识驱动模型(KB model)构建,生成了成对的数字乳腺X线摄影(DM)和数字乳腺断层合成(DBT)影像。该数据集不仅包含二维和三维影像的精确配对,还提供了像素级组织分割标注和多种乳腺组织的边界框标注,为深度学习模型训练提供了丰富的结构化数据支持。
特点
T-SYNTH数据集最显著的特点在于其全面的标注体系和多模态影像配对。数据集囊括了不同密度乳腺组织的精细标注,包括病变检测所需的关键特征。通过平衡的子群设计,数据集能够反映真实临床场景中不同组织密度对检测性能的影响规律。这种精心设计的标注体系使得该数据集特别适合用于医学影像分析中的迁移学习和模型鲁棒性研究。
使用方法
研究人员可通过Huggingface平台直接访问T-SYNTH数据集。该数据集主要应用于乳腺病变检测模型的训练与验证,特别是在数据增强场景中表现突出。实践表明,当真实患者数据有限时,将T-SYNTH作为补充训练数据能显著提升Faster-RCNN等模型在DM和DBT影像上的检测性能。数据集提供的多模态配对影像还可用于跨模态特征学习研究。
背景与挑战
背景概述
T-SYNTH数据集是由Christopher Wiedeman、Anastasiia Sarmakeeva等研究人员于2023年联合开发的一个基于知识模型(KB model)的合成乳腺图像数据集。该数据集包含了配对的数字乳腺X线摄影(DM)和数字乳腺断层合成(DBT)图像,并提供了像素级的分割标注和多种乳腺组织的边界框标注。T-SYNTH的发布为医学影像分析领域提供了重要的数据资源,特别是在乳腺病变检测和亚组分析方面展现出显著的应用潜力。该数据集通过合成数据的方式,解决了真实医学影像数据获取困难、标注成本高昂等问题,为深度学习模型在医学影像领域的应用提供了新的可能性。
当前挑战
T-SYNTH数据集在解决乳腺影像分析问题时面临多重挑战。从领域问题来看,乳腺病变检测在密度不均的组织背景下具有较高的复杂性,尤其是低密度病变的识别存在显著困难。数据构建过程中,研究人员需克服合成图像与真实影像间的域差距问题,确保合成数据在纹理、形态和病理特征上的真实性。同时,生成配对的DM和DBT图像并保持解剖学一致性,对知识模型的构建提出了较高要求。此外,数据标注的精确性直接影响到模型训练效果,像素级分割和边界框标注需要专业的医学知识支持,进一步增加了数据集构建的难度。
常用场景
经典使用场景
在医学影像分析领域,T-SYNTH数据集通过提供成对的数字乳腺X线摄影(DM)和数字乳腺断层合成(DBT)图像,为研究人员提供了一个标准化的测试平台。这些图像不仅包含多种乳腺组织的像素级分割和边界框标注,还支持深度学习模型在乳腺病变检测任务中的训练与验证。数据集特别适用于探索不同乳腺密度下病变检测的性能差异,为算法优化提供了丰富的数据支持。
实际应用
T-SYNTH数据集的实际应用主要集中在医学影像的计算机辅助诊断领域。通过合成数据增强真实患者数据的训练集,可以显著提升病变检测模型的性能。例如,在数字乳腺断层合成(DBT)和传统乳腺X线摄影(DM)中,使用T-SYNTH数据训练的模型能够更准确地识别和定位病变,尤其是在乳腺组织密度较高的情况下,这一优势尤为明显。
衍生相关工作
T-SYNTH数据集的发布催生了一系列相关研究,特别是在乳腺影像分析和深度学习领域。基于该数据集,研究人员开发了多种改进的病变检测算法,如Faster-RCNN的变体,这些算法在合成数据和真实数据上均表现出色。此外,数据集还被用于探索数据增强技术对模型泛化能力的影响,为医学影像分析的算法优化提供了新的思路。
以上内容由遇见数据集搜集并总结生成



