five

HyKid

收藏
arXiv2025-09-24 更新2025-09-25 收录
下载链接:
https://www.synapse.org/Synapse:syn68544889
下载链接
链接失效反馈
官方服务:
资源简介:
HyKid数据集是一个包含48名儿童脑积水患者的开源数据集,由浙江大学医学院附属儿童医院放射科提供。该数据集包含了经过专家标注的脑组织分割结果,包括白质、灰质、外侧脑室、外部脑脊液和脉络丛等。此外,还提取了临床放射学报告中的结构化数据。该数据集旨在为神经影像算法的开发提供一个高质量的基准,并揭示脉络丛在脑积水评估中的作用。

The HyKid Dataset is an open-source dataset containing 48 pediatric hydrocephalus patients, provided by the Department of Radiology, Children's Hospital Affiliated to Zhejiang University School of Medicine. This dataset includes expert-annotated brain tissue segmentation results, covering white matter, gray matter, lateral ventricles, external cerebrospinal fluid, choroid plexus, and other related structures. Additionally, structured data extracted from clinical radiology reports is also included. This dataset aims to provide a high-quality benchmark for the development of neuroimaging algorithms, and to reveal the role of the choroid plexus in hydrocephalus assessment.
提供机构:
浙江大学
创建时间:
2025-09-24
搜集汇总
数据集介绍
main_image_url
构建方式
在儿科脑积水影像研究领域,高质量数据集的稀缺制约着相关算法的进步。HyKid数据集通过整合48例儿科患者的临床资料,采用多模态构建策略:首先利用NiftyMIC切片到体积重建技术将常规低分辨率MRI提升至1毫米各向同性分辨率;随后由经验丰富的神经学家对白质、灰质、侧脑室、外部脑脊液及脉络丛进行人工校正分割;同时基于检索增强生成框架从非结构化临床报告中提取病因学、脑室变化趋势等结构化信息,形成三维影像与临床参数的多维映射。
特点
该数据集的独特价值体现在其专业标注的全面性与病理特异性。除常规脑组织分割外,HyKid首次在儿科脑积水数据中提供了脉络丛的精细标注,为探究脑脊液动力学机制奠定基础。数据集包含2054张轴向切片,覆盖从新生儿至青少年的广泛年龄区间(0-17岁),且通过超分辨率重建有效克服了儿科MRI常见的运动伪影问题。更关键的是,其临床数据与影像 biomarkers 的耦合验证了脉络丛体积与总脑脊液体积的强相关性(Spearman's ρ=0.37, p=0.013),揭示了新型评估指标的可能性。
使用方法
研究者可通过公开平台获取该数据集后,沿三个维度展开应用:在算法开发层面,可利用原始低分辨率影像与重建结果对比验证超分辨率模型性能;分割任务中可基于金标准标注评估自动化工具对脑室、脉络丛等结构的识别精度。临床研究方面,整合影像特征与结构化临床变量(如病因分型、术后状态)可构建预测模型,已有研究证实结合脉络丛与总脑脊液体积的逻辑回归模型对病情趋势预测AUC达0.87。此外,分层分析框架支持按病因、脑室变化等亚组探究生物标志物的异质性表达。
背景与挑战
背景概述
儿童脑积水作为一种由脑脊液异常积聚引发的神经系统疾病,其发病率约为每500名新生儿中1例,是导致儿童神经外科手术的主要原因之一。由浙江大学医学院附属儿童医院放射科与浙江大学 Biomedical Engineering and Instrument Science 学院的研究团队于2025年共同创建的HyKid数据集,旨在解决儿科脑积水研究中公开、专家标注数据匮乏的瓶颈问题。该数据集包含48名儿科患者的3D高分辨率MRI影像,通过切片到体积的超分辨率算法重建至1毫米各向同性分辨率,并由经验丰富的神经学家手动标注了白质、灰质、侧脑室、外部脑脊液及脉络丛等关键脑组织结构。HyKid的建立为脑积水病理机制研究提供了高质量基准,尤其强调了脉络丛在脑脊液动力学中的潜在生物标志物作用。
当前挑战
HyKid数据集致力于应对儿科脑积水评估中的核心挑战,即传统影像生物标志物(如脑室体积)在预测临床预后方面的局限性。构建过程中面临多重技术难题:儿科MRI常因运动伪影和快速采集序列导致分辨率低下,需采用切片到体积重建技术提升图像质量;脉络丛的精细解剖结构使其自动化分割极具挑战,现有工具如SPM12和SynthSeg在该任务中表现不佳,依赖专家手动校正;临床数据非结构化问题则通过检索增强生成框架提取关键信息,但需克服语言模型幻觉风险。这些挑战凸显了多模态数据融合与高精度分割算法在儿科神经影像研究中的迫切需求。
常用场景
经典使用场景
在儿科脑积水研究中,HyKid数据集作为高质量基准平台,广泛应用于神经影像算法的开发与验证。其核心价值在于提供了专家手动校正的脑组织分割标签,包括白质、灰质、侧脑室、外部脑脊液及脉络丛,为分割算法的性能评估提供了金标准。通过整合高分辨率三维MRI重建图像与结构化临床数据,该数据集支持从图像特征中量化脑脊液动力学异常,尤其聚焦于脉络丛体积与脑脊液总量的关联分析,为理解脑积水病理机制提供了关键数据支撑。
衍生相关工作
HyKid数据集催生了多项神经影像方法学的创新研究,例如基于切片到体积超分辨率算法(如NiftyMIC)的改进工作,以及针对脉络丛分割的专用深度学习模型(如两阶段3D U-Net)。其临床数据提取框架(RAG技术)启发了电子健康记录的结构化处理研究,促进了多模态数据融合模型的开发。后续研究进一步利用该数据集验证了总脑脊液体积相较于传统脑室体积在预测临床结局中的优越性,推动了脑积水生物标志物研究范式的转变。
数据集最近研究
最新研究方向
在儿科脑积水影像分析领域,HyKid数据集的推出为探索脉络丛与脑脊液动力学的关联机制开辟了新路径。当前研究聚焦于利用高分辨率MRI重建与专家标注的脉络丛分割数据,揭示脉络丛体积与总脑脊液容积的强相关性,这一发现超越了传统脑室容积指标的局限性,为评估临床预后提供了更敏感的影像学生物标志物。前沿工作进一步结合检索增强生成技术提取结构化临床信息,构建逻辑回归模型预测脑积水病情趋势,展现出脉络丛-脑脊液耦合效应在个体化诊疗中的潜在价值。该数据集正推动超分辨率重建算法与多结构分割模型的协同优化,为理解儿童脑积水的病理生理机制建立了高质量基准平台。
相关研究论文
  • 1
    HyKid: An Open MRI Dataset with Expert-Annotated Multi-Structure and Choroid Plexus in Pediatric Hydrocephalus浙江大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作