five

Angelou0516/BONBID-HIE

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/BONBID-HIE
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-nd-4.0 task_categories: - image-segmentation modality: - MRI language: [] tags: - medical-imaging - neonatal-brain - hypoxic-ischemic-encephalopathy - HIE - lesion-segmentation - diffusion-MRI - ADC - 3D pretty_name: BONBID-HIE size_categories: - n<1K configs: - config_name: default data_files: - split: train path: data/train-* - split: val path: data/val-* dataset_info: features: - name: subject_id dtype: string - name: split dtype: string - name: num_slices dtype: int32 - name: lesion_voxels dtype: int32 - name: preview_slice_idx dtype: int32 - name: adc_slice dtype: image - name: zadc_slice dtype: image - name: lesion_mask dtype: image - name: overlay dtype: image splits: - name: train num_bytes: 1370200 num_examples: 85 - name: val num_bytes: 42629 num_examples: 4 download_size: 1449540 dataset_size: 1412829 --- # BONBID-HIE **BONBID-HIE** (BOston Neonatal Brain Injury Dataset for Hypoxic Ischemic Encephalopathy) is a curated MRI dataset for neonatal HIE lesion segmentation, released as part of the MICCAI 2023 BONBID-HIE challenge. ## Dataset Summary | Field | Details | |---|---| | Modality | Diffusion MRI (ADC-derived maps) | | Body Part | Neonatal brain (term/late-preterm with HIE) | | Subjects (Train) | 85 | | Subjects (Val) | 4 (Docker sanity-check split) | | Subjects (Test) | 44 (password-encrypted, not redistributed here) | | Format | MetaImage `.mha` (3D volumes) | | Total Size | ~1.3 GB | | Scanners | GE 1.5T Signa, Siemens 3T Trio | | License | CC BY-NC-ND 4.0 | ## Data Structure Each split contains three parallel directories: - `1ADC_ss/` — skull-stripped Apparent Diffusion Coefficient map (model **input**) - `2Z_ADC/` — Z-score normalized ADC map (additional input/aid; **NOT ground truth**) - `3LABEL/` — manual expert lesion annotation (**recommended ground truth**, train/val only) File naming: - `1ADC_ss/MGHNICU_{ID}-VISIT_01-ADC_ss.mha` - `2Z_ADC/Zmap_MGHNICU_{ID}-VISIT_01-ADC_smooth2mm_clipped10.mha` - `3LABEL/MGHNICU_{ID}-VISIT_01_lesion.mha` Plus `BONBID2023_clinicaldata_val.xlsx` (clinical metadata for the val split). ## Ground Truth The recommended ground truth is the **manual expert lesion annotation** in `3LABEL/`, drawn by a trained physician using MRICroN. For 27 uncertain cases, consensus was reached among three pediatric neuroradiologists. The `2Z_ADC/` map is provided as an algorithm-development aid and is NOT a ground-truth annotation. ## Notes - Test split is omitted: it was distributed only to MICCAI 2023 challenge participants and is password-encrypted on Zenodo. Training samples (n=85) plus validation (n=4) are reproduced here. - Val split is small (n=4) — intended as a Docker sanity-check, not a statistical validation set. Cross-validation on the train split is the typical evaluation strategy. ## Citation ```bibtex @article{bao2024bonbid, title = {{BOston Neonatal Brain Injury Data for Hypoxic Ischemic Encephalopathy (BONBID-HIE): I. MRI and Lesion Labeling}}, author = {Bao, Rina and Song, Ya'nan and Bates, Sara V. and others}, journal = {Scientific Data}, publisher = {Nature}, year = {2024}, doi = {10.1038/s41597-024-03986-7}, url = {https://www.nature.com/articles/s41597-024-03986-7} } ``` ## Source Original release: [Zenodo record 10602767](https://zenodo.org/records/10602767) (V3, paper-cited) Challenge portal: [bonbid-hie2023.grand-challenge.org](https://bonbid-hie2023.grand-challenge.org/)

BONBID-HIE (BOston Neonatal Brain Injury Dataset for Hypoxic Ischemic Encephalopathy) is a curated MRI dataset for neonatal HIE lesion segmentation. It contains 3D brain scans in diffusion MRI (ADC-derived maps) modality, primarily from GE 1.5T Signa and Siemens 3T Trio scanners. The dataset is divided into training set (85 cases) and validation set (4 cases), with test set (44 cases) not included in this release. Data is in MetaImage .mha format with total size ~1.3GB. Each sample contains three types of data: 1) skull-stripped ADC map (model input); 2) Z-score normalized ADC map (auxiliary input, NOT ground truth); 3) manual expert lesion annotation (recommended ground truth). The dataset follows CC BY-NC-ND 4.0 license and was released as part of the MICCAI 2023 BONBID-HIE challenge.
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
BONBID-HIE数据集专为新生儿缺血缺氧性脑病(HIE)病灶分割任务而构建,源自MICCAI 2023挑战赛。该数据集基于扩散MRI采集的ADC图,涵盖85例训练样本与4例验证样本,另含44例测试样本用于挑战赛评估。数据以MetaImage(.mha)三维体积格式存储,包含去颅骨ADC图、Z-score标准化ADC图及由经验丰富的放射科医师使用MRICroN软件手动标注的病灶掩膜。针对27例模糊病例,经过三位儿科神经放射学专家的共识审核以确保标注可靠性,从而为深度学习模型提供高质量的标注基准。
特点
本数据集具备鲜明的临床与研究导向特征,采用来自GE 1.5T Signa和Siemens 3T Trio两种扫描仪的双中心数据,增强了模型的泛化潜力。其独特之处在于同时提供原始ADC图和Z-score标准化图,后者作为辅助输入而非金标准,旨在助力算法开发时提升鲁棒性。验证集仅含4例样本,专为Docker健康检查设计,不适用于统计验证,故而推荐研究者采用训练集内部交叉验证策略进行模型评估。
使用方法
数据集以Hugging Face标准格式发布,包含默认配置的'train'与'val'两个分割,可直接通过datasets库加载。每个样本提供subject_id、分割标签、切片数量、病灶体素数以及预视切片索引等元数据,以及adc_slice、zadc_slice、lesion_mask等二维切片图像字段,便于即开即用。建议将3LABEL目录下的手工病灶标注作为真值进行监督学习,同时可结合2Z_ADC图增强模型输入。对于完整三维体积处理,需参考原始Zenodo存储库中未分割的.mha文件。
背景与挑战
背景概述
新生儿缺氧缺血性脑病(HIE)是导致围产期死亡与长期神经发育障碍的首要病因,其病理核心在于脑白质及深部灰质核团的缺血性损伤。磁共振成像(MRI),特别是表观弥散系数(ADC)图,能在早期敏感地揭示细胞毒性水肿区域,为临床干预提供关键影像学依据。然而,HIE病灶的手动分割极度依赖专家经验,且不同观察者间一致性较差,亟需标准化、高质量的自动分割模型。在此背景下,波士顿儿童医院、麻省总医院等机构的研究团队于2023年MICCAI挑战赛中发布了BONBID-HIE数据集。该数据集精心收集了来自GE 1.5T和Siemens 3T两种扫描仪的ADC及Z-score归一化ADC图像,包含85例训练样本、4例验证样本及44例测试样本,并由资深儿科神经放射科医师完成像素级病灶标注,对其中27例疑难病例经过三人专家共识达成最终标签。BONBID-HIE的发布填补了新生儿HIE病灶分割领域公开基准数据的空白,推动了深度学习在该疾病自动量化分析中的研究进程,为新生儿脑损伤的精准诊断与预后评估奠定了重要数据基础。
当前挑战
BONBID-HIE数据集主要应对两重挑战。在领域问题层面,新生儿HIE病灶的自动分割面临核心难点:病灶在ADC图上表现为边界模糊的低信号区域,常与正常脑白质发育过程中的低信号区相互混淆,且病灶大小、形态及位置在不同患儿间差异悬殊,加剧了语义分割模型对微小病变和复杂边界的辨识困难。此外,HIE多灶性、双侧对称或不对称的分布模式,要求模型具备全局上下文感知能力。在数据构建过程中,研究团队遭遇了多重技术挑战:原始MRI数据因医院来源不同(1.5T与3.0T)而存在强度非均匀性和扫描参数差异,需要统一预处理流程,包括颅骨剥离、空间标准化及Z-score归一化,但归一化过程中引入的平滑参数选择(如2mm高斯核)可能部分掩盖细微病灶信号。更关键的是,专家标注阶段面临严重的不确定性——约三分之一的病例因病灶极其模糊或位于低对比度区域,最初标注结果存在分歧,只得通过三名专家反复讨论达成共识,这一过程不仅耗时巨大,也暴露了小样本数据中标注一致性难以保证的固有问题。最终,验证集仅含4例样本,无法满足统计显著性的评估需求,迫使研究者采用训练集内部交叉验证策略,增加了模型选择与超参数调优的不稳定性。
常用场景
经典使用场景
BONBID-HIE数据集是新生儿缺氧缺血性脑病(HIE)领域内弥散磁共振成像研究的重要资源,其经典使用场景集中于病灶分割任务。研究人员利用该数据集提供的头颅剥离表观弥散系数(ADC)图和Z-score归一化ADC图作为模型输入,结合专家手动标注的病变掩膜,训练和验证深度学习分割算法。在MICCAI 2023 BONBID-HIE挑战赛中,该数据集被用作标准基准,推动三维卷积神经网络或Transformer架构在新生儿脑部病变精准分割中的探索与竞逐。
解决学术问题
在学术研究中,BONBID-HIE数据集解决了新生儿HIE病灶自动分割缺乏标准化、大规模且高质量标注数据集的迫切问题。此前,由于HIE病灶形态不规则、边界模糊且个体差异显著,依赖人工勾画既耗时又易引入主观偏差。该数据集的发布不仅为算法提供了可靠的训练和验证物质基础,还通过提供多中心扫描仪采集的影像(涵盖1.5T和3T设备),促进了跨设备泛化性的研究,其意义在于加速了早诊工具从实验室向临床转化的进程。
衍生相关工作
基于BONBID-HIE数据集,衍生出一系列具有影响力的经典工作。MICCAI 2023挑战赛的参赛方法汇集了多种前沿分割框架,包括U-Net变体、注意力机制模型以及半监督学习策略。配套发表的原始论文(Bao等,2024,Scientific Data)详细阐述了数据采集和标注规范,为后续研究提供了方法论参考。此外,该数据集的公开部分常被用作迁移学习和域适应研究的对比基准,催生了针对新生儿脑部小病灶、低对比度特点的专门网络架构创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作