five

多中心标注的CoW数据集

收藏
arXiv2026-04-30 更新2026-05-02 收录
下载链接:
https://arxiv.org/abs/2604.27357v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由中国科学院团队构建,是首个大规模多中心标注的Circle of Willis(CoW)血管分割专用数据集,整合了来自ADAM、BraVa等14个公开源的1341例时间飞跃法磁共振血管造影(TOF-MRA)影像,覆盖不同扫描设备和人群特征。数据经过标准化预处理,包含20类CoW动脉结构的精细标注,特别针对小血管(如后交通动脉)进行了半径信息标注。通过模板配准和ROI裁剪实现了跨中心数据空间对齐,为血管拓扑连续性研究和多类分割算法开发提供了重要基准。数据集主要应用于脑血管疾病诊断、阿尔茨海默病血管形态学生物标志物发现等神经影像研究领域。

This dataset was constructed by a team from the Chinese Academy of Sciences, and it is the first large-scale multi-center annotated dedicated dataset for Circle of Willis (CoW) vascular segmentation. It incorporates 1341 time-of-flight magnetic resonance angiography (TOF-MRA) images from 14 public sources including ADAM and BraVa, covering diverse scanning equipment and population characteristics. The data has undergone standardized preprocessing, with fine-grained annotations for 20 types of CoW arterial structures; specifically, radius information annotations are provided for small vessels such as the posterior communicating artery. Spatial alignment of cross-center data is realized through template registration and ROI cropping, providing an important benchmark for vascular topological continuity research and the development of multi-class segmentation algorithms. This dataset is primarily applied in neuroimaging research fields such as cerebrovascular disease diagnosis and the discovery of vascular morphological biomarkers for Alzheimer's disease.
提供机构:
中国科学院·自动化研究所; 中国科学院·脑认知与脑机智能技术国家重点实验室; 中国科学院大学·人工智能学院; 中国科学院大学·未来技术学院
创建时间:
2026-04-30
搜集汇总
数据集介绍
main_image_url
构建方式
多中心标注的CoW数据集基于来自ADAM、BraVa、CHUV、ICBM、IXI、MIDAS、OASIS和TopCoW等14个公开发布扫描中心的1341例人脑飞行时间磁共振血管成像(TOF-MRA)图像构建。数据集包含威利斯环(Circle of Willis, CoW)的20条动脉,由专家按照统一的解剖学标注标准进行人工标注,且所有图像首先被重新定向至标准RAS坐标系,并通过模板配准和裁剪提取出覆盖CoW区域的80×80×80体素立方体感兴趣区域。
特点
该数据集具有显著的多中心异质性,涵盖不同成像参数、扫描仪型号和受试者群体,包括来自OASIS的阿尔茨海默病(AD)患者数据。数据集中926例用于模型开发和五折交叉验证,415例作为独立测试集,另包含10名健康受试者的40次重复扫描(MSC数据集)用于重测信度分析。多样化的数据来源为评估模型在不同成像条件下的泛化能力和鲁棒性提供了坚实基础。
使用方法
研究者可将该数据集用于CoW多类分割模型的训练与评估。推荐采用nnResUNet等骨干网络,并结合论文提出的AG-TAL损失函数(包含半径感知Dice损失、断裂感知clDice损失和邻域感知共现损失)进行训练。数据集支持五折交叉验证协议,独立测试集可用于评估模型在未见数据上的跨中心泛化性能,重测数据集尤适合评估分割结果的再现性和可靠性。
背景与挑战
背景概述
多中心标注的CoW数据集由中国科学院自动化研究所的刘佳璐、崔跃与余山团队于近年构建,聚焦于大脑动脉环(Circle of Willis)的多类分割任务。威利斯环作为脑部重要的侧支循环通路,其解剖结构的精确分割对神经血管疾病管理至关重要,然而现有方法常因血管拓扑复杂、形态多变而面临分割不连续与分类混淆的困境。该数据集汇聚了来自14个公开扫描中心的1341例时间飞跃法磁共振血管成像(TOF-MRA)数据,遵循统一的解剖标注标准,覆盖20条动脉节段,旨在为多类血管分割提供大规模、多样化的训练与评估基准。数据集不仅整合了跨中心、跨扫描仪的异质性样本,还通过精细的手动标注解决了此前公共数据集中标注细节缺失的问题,为开发鲁棒且可泛化的深度学习方法奠定了坚实基础,显著推动了脑血管影像分析领域的发展。
当前挑战
该数据集面临的核心挑战首先源于威利斯环自身的高度解剖变异,诸如后交通动脉的先天缺失或管径差异,使得分割模型需在保持拓扑连续性的同时避免对变异结构的过拟合。其次,多类分割中细小动脉(如前脉络膜动脉)的类间不平衡问题突出,易被误分类或断裂;而邻近动脉(如双侧大脑前动脉A2段)因空间毗邻导致特征混淆,传统损失函数难以有效区分。在构建过程中,挑战集中体现在跨中心数据异质性的处理上:不同扫描设备的参数差异、图像分辨率不统一以及噪声水平多变,要求预处理流程具备鲁棒的空间标准化能力。此外,手工标注20条动脉节段的工作量庞大,标注者间一致性的保证也是一大难题,特别是对于直径微小且走向迂曲的血管,需反复校验以维持标注质量。
常用场景
经典使用场景
在脑血管影像分析领域,多中心标注的CoW数据集首要服务于威利斯环的多类别精细化分割任务。该数据集整合了来自14个公开扫描中心的1341例时间飞跃磁共振血管成像数据,涵盖不同厂商、场强和分辨率的影像,为训练和评估深度学习模型提供了异构性强、标注统一的基准平台。经典使用场景包括基于nnUNet等U型架构的自动分割,尤其在处理细小动脉(如后交通动脉、脉络膜前动脉)时,该数据集能够支撑拓扑连续性约束和类别间判别性学习的验证。研究人员常以此数据集为核心,开展五折交叉验证,评估模型在20条动脉和背景共21类上的分割精度,并对比不同损失函数对血管连通性和边缘保持能力的影响。
衍生相关工作
该数据集的发布催生了一系列相关研究工作。在方法层面,AG-TAL本身作为轻量级即插即用损失函数,被证实可兼容CNN、Transformer(SwinUNETR)和Mamba(U-Mamba)等多种骨干网络,激发了将解剖先验嵌入损失设计的新范式。在评估基准方面,该数据集弥补了现有公开MRA数据集(如IXI、OASIS、TopCoW)中注释不全或中心单一的不足,为后续研究提供了涵盖20条动脉统一标注的多中心标准,已被用于验证clDice、cbDice、BettiMatching等拓扑损失方法在脑血管分割中的泛化能力。在临床延伸上,该数据集促成了血管形态学与认知功能的关联分析,启发了利用分割结果进行阿尔茨海默病微血管损伤量化的系列探索。
数据集最近研究
最新研究方向
当前,针对Willis环(CoW)的多类别分割研究聚焦于解决小血管断裂及相邻动脉间误分类的拓扑与解剖学挑战。前沿方向包括开发新型拓扑感知损失函数,例如本工作提出的解剖引导拓扑感知损失(AG-TAL),其整合了半径感知Dice损失以处理小血管类别不均衡、断裂感知clDice损失通过组卷积高效保留局部连通性,以及邻接感知共现损失利用解剖先验强制相邻动脉间正确分类边界。该研究基于大规模多中心标注数据集,在六个独立数据集上验证了模型的强泛化能力,并成功应用于阿尔茨海默病队列,揭示了血管形态改变与认知功能的关联,为神经血管疾病的影像学生物标志物发现提供了新的计算范式。
相关研究论文
  • 1
    AG-TAL: Anatomically-Guided Topology-Aware Loss for Multiclass Segmentation of the Circle of Willis Using Large-Scale Multi-Center Datasets中国科学院·自动化研究所; 中国科学院·脑认知与脑机智能技术国家重点实验室; 中国科学院大学·人工智能学院; 中国科学院大学·未来技术学院 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作