Angelou0516/TOM500
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/TOM500
下载链接
链接失效反馈官方服务:
资源简介:
TOM500数据集是一个公开的甲状腺眼病轨道MRI数据集,包含500名临床确诊甲状腺眼病(TED)患者的冠状T2加权DRIVE轨道MRI图像。数据集提供了九个眼周结构的多器官分割标签和临床元数据。图像分辨率为0.3125 mm,切片厚度为3.5 mm,体积形状为512 × 512 × 20。数据集分为训练集(400例)和验证集(100例)。标注由三名初级放射科医生完成,经过STAPLE共识和高级专家审查/修正。数据集总大小约为2.4 GB,采用CC0 1.0许可证发布。数据来源为上海第九人民医院2016年6月至2021年1月的队列。
The TOM500 dataset is a public release of coronal T2-weighted DRIVE orbital MRI from 500 patients with clinically confirmed Thyroid Eye Disease (TED), featuring multi-organ segmentations of nine periocular structures and bundled clinical metadata. The in-plane resolution is 0.3125 mm, slice thickness is 3.5 mm, and volume shape is 512 × 512 × 20. The dataset is split into 400 training and 100 validation cases. Annotations were performed by 3 junior radiologists per case, followed by STAPLE consensus and senior expert review/correction. The total dataset size is ~2.4 GB, released under CC0 1.0 license. The cohort comes from Shanghai Ninth Peoples Hospital between Jun 2016 – Jan 2021.
提供机构:
Angelou0516
搜集汇总
数据集介绍

构建方式
TOM500数据集源自上海第九人民医院2016年6月至2021年1月期间收治的500例经临床确诊的甲状腺眼病(TED)患者,采集设备为3.0T Philips Ingenia磁共振仪及32通道头线圈,获取冠状位T2加权DRIVE序列眼眶MRI影像。每例影像包含20层512×512像素的断层扫描,面内分辨率达0.3125毫米,层厚3.5毫米。数据集的标注流程严谨:每例影像由三名初级放射科医师独立完成九种眶周结构的像素级分割,随后采用STAPLE算法融合生成共识标签,最后由资深专家逐一审核修正,确保了标注的可靠性与医学准确性。最终构建的训练集包含400例,验证集100例,影像与对应掩膜以NIfTI格式组织存储。
特点
该数据集的核心特点在于专注于甲状腺眼病这一特定疾病场景下的眼眶多器官精细分割,涵盖视神经、眶脂体、泪腺、眼球、上直肌与提上睑肌复合体、下直肌、内直肌、外直肌及上斜肌共9种关键解剖结构,标注类别总数达10类(含背景)。影像采用T2加权DRIVE序列,对眼眶软组织具有卓越的对比度增强效果,有利于病变区域的识别。此外,数据集附带了患者的临床元数据(如性别、年龄、病程、吸烟史),为影像表型与临床特征的关联分析提供了丰富的信息基础。整个数据集的规模约为2.4 GB,并以CC0 1.0许可证开放获取,促进了医学影像分析社区的共享与创新。
使用方法
TOM500数据集可直接用于训练和评估基于深度学习的眼眶MRI分割模型。用户可从HuggingFace数据集页面或Figshare源获取数据,其目录结构清晰划分为train和val两个子集,每个子集下分别包含image和label文件夹,影像文件和标签文件均以患者ID命名的NIfTI格式(.nii.gz)存储。研究人员可借助Python中的nibabel或SimpleITK库加载影像与掩膜张量,结合MONAI、nnU-Net等医学影像分析框架进行模型搭建与训练。数据集预设了基于HuggingFace Datasets库的加载接口,支持按批次获取patient_id、split、num_slices、selected_slice、t2_middle_slice、mask_middle_slice及overlay_middle_slice等特征,便于快速开展实验。
背景与挑战
背景概述
甲状腺眼病(Thyroid Eye Disease, TED)是Graves病最常见的并发症之一,其病理机制涉及眼眶软组织的炎症与纤维化,可导致眼球突出、复视甚至视神经压迫性损伤。然而,由于眼眶解剖结构复杂、组织边界模糊,传统影像学评估依赖放射科医师的主观经验,缺乏标准化定量分析工具。TOM500数据集由上海第九人民医院的研究团队于2024年创建,并于2025年正式发布在《Scientific Data》期刊上(Zhang et al., 2025)。该数据集包含500例经临床确诊的TED患者的冠状位T2加权DRIVE眼眶磁共振成像,由三位初级放射科医师采用STAPLE算法融合标注后,经高级专家审核修正,最终生成涵盖视神经、眶脂、眼外肌等九种眼眶结构的精细多器官分割标签。TOM500的问世填补了眼眶医学影像公开数据集领域的空白,为基于深度学习的TED自动分割、疾病进展预测及治疗响应评估提供了高质量基准,显著推动了眼眶影像组学与定量分析研究的发展。
当前挑战
TOM500所解决的领域核心挑战在于:眼眶MRI中多器官分割任务长期受困于组织边界模糊(如眼外肌与眶脂的灰度重叠)、解剖形态个体差异大,以及视神经、上斜肌等小结构在低分辨率切片中难以辨识等问题,传统手工分割耗时长且一致性差。在数据集构建过程中,团队面临多重技术挑战:首先,TED患者眼眶病理改变(如眼肌肥厚、纤维化)导致标准解剖图谱失效,需制定适应病态组织的标注协议;其次,500例MRI数据来自六年跨度的临床队列,需统一不同采集参数下的图像强度与伪影校正;最后,通过STAPLE算法融合三位初级医师的标注后,仍存在约8%的解剖边界分歧,需高级专家逐例修正,但专家疲劳导致的标注偏差控制缺乏量化校验机制。这些挑战使得TOM500在保证标注质量的同时,成为目前规模最大、标注最复杂的眼眶多器官分割数据集。
常用场景
经典使用场景
在眼科影像与人工智能交叉领域,TOM500数据集为甲状腺眼病(TED)的影像组学分析提供了迄今为止规模最大的标准化基准。其核心任务聚焦于眼眶九种精细解剖结构(包括视神经、眼外肌群、泪腺及眶脂肪等)的多器官语义分割。研究人员通常采用基于U-Net及其变体(如nnU-Net、SwinUNETR)的深度学习架构,在该数据集的400例训练样本上进行监督学习,并在100例验证样本上评估Dice相似系数、豪斯多夫距离等指标。该数据集独特的高分辨率冠状位T2-DRIVE序列(面内分辨率0.3125 mm)使得微小眼外肌的边界辨识成为可能,尤其适用于甲状腺相关眼病中眼外肌肥厚、纤维化等病理特征的分割挑战。
解决学术问题
TOM500数据集的发布针对性解决了甲状腺眼病影像研究中长期存在的关键瓶颈:高质量多器官标注数据的匮乏与标注标准的不统一。此前该领域鲜有包含超过百例病例的公开眼眶MRI分割数据,且标注往往局限于单个结构(如仅提取眼外肌或视神经),难以支撑系统性全眼眶结构分析。该数据集通过三位初级放射科医师独立标注后采用STAPLE算法融合、再经资深专家逐例修正的三级质控流程,生成了目前堪称金标准的多类分割标签,使得基于影像的TED量化评估从定性描述迈入可重复的定量时代。其问世直接推动了眼眶解剖计量学(如肌锥面积比、视神经受压指数)的自动计算研究,并为探索影像生物标志物与疾病临床活动度、治疗预后的因果关联提供了数据基石。
衍生相关工作
自TOM500公开以来,已衍生出多项具有代表性的学术工作。首先,基于该数据集的基线方法(如3D U-Net与nnUNet)的性能比较成为该领域的参照系,多篇论文以此为标准验证新型注意力机制或半监督分割框架的有效性。其次,该数据集催生了针对TED特有的眼眶结构形变先验建模研究,例如利用空间变换网络融合解剖先验知识的多任务学习模型,成功提升了被炎症浸润的眼外肌分割鲁棒性。此外,在数据稀缺场景下,研究者基于TOM500的标注分布特征开发了面向医学影像的域适应技术,将眼眶MRI分割知识迁移至基于CT的甲状腺眼病分析任务中。最后,该数据集还助力了影像-临床联合预测模型的建立,通过提取分割区域的影像组学特征与患者年龄、吸烟史等元数据融合,实现了对TED活动性分级的精准预测。
以上内容由遇见数据集搜集并总结生成



