five

Brain Hemorrhage Segmentation Dataset (BHSD)

收藏
arXiv2023-08-23 更新2024-06-21 收录
下载链接:
https://github.com/White65534/BHSD
下载链接
链接失效反馈
官方服务:
资源简介:
BHSD是由澳大利亚机器学习研究所和Flinders健康与医疗研究研究所合作开发的一个3D多类别脑出血分割数据集。该数据集包含2192个高分辨率3D脑CT扫描,涵盖了五种不同类型的脑出血,具有像素级和切片级注释。BHSD的创建旨在解决现有公共脑出血数据集不支持多类别分割问题,通过提供详细注释的数据集,支持深度学习模型在脑出血分割任务中的应用。该数据集不仅支持临床诊断和治疗规划,还为研究提供了丰富的资源,以开发和评估更精确的脑出血分割技术。

BHSD is a 3D multi-class intracerebral hemorrhage (ICH) segmentation dataset developed through a collaboration between the Australian Institute of Machine Learning and Flinders Health and Medical Research Institute. This dataset comprises 2192 high-resolution 3D brain CT scans, covering five distinct types of intracerebral hemorrhages, with pixel-level and slice-level annotations. BHSD was created to address the limitation that existing public intracerebral hemorrhage datasets do not support multi-class segmentation tasks. By providing a meticulously annotated dataset, it enables the application of deep learning models for intracerebral hemorrhage segmentation tasks. In addition to supporting clinical diagnosis and treatment planning, this dataset also serves as a valuable research resource for developing and evaluating more accurate intracerebral hemorrhage segmentation technologies.
提供机构:
澳大利亚机器学习研究所,阿德莱德大学
创建时间:
2023-08-22
搜集汇总
数据集介绍
main_image_url
构建方式
在颅内出血影像分析领域,构建高质量标注数据集对推动深度学习技术发展至关重要。BHSD数据集基于RSNA公开数据集,通过重建三维CT扫描并整合原始切片级标注,构建了包含2192个三维脑部CT扫描的集合。其中,192个扫描由医学影像专家进行像素级多类别标注,涵盖硬膜外出血、脑实质内出血等五类出血类型;其余2000个扫描则保留切片级标注,形成多层次标注体系。标注过程采用独立分割与放射科医师审核的双阶段流程,确保了标注的准确性与临床可靠性。
使用方法
该数据集适用于多种机器学习任务,尤其在监督与半监督分割模型中表现突出。在监督学习场景下,研究者可利用像素级标注训练三维分割网络,实现多类别出血的精确定位;同时,结合切片级标注数据,可构建弱监督学习框架。对于半监督学习,数据集支持将未标注样本纳入训练流程,通过伪标签生成等技术提升模型性能。实验表明,采用交叉伪监督等方法能有效利用未标注数据,提升分割精度。此外,数据集还支持类别平衡分析与假阳性抑制研究,为临床辅助诊断工具开发提供验证平台。
背景与挑战
背景概述
颅内出血(ICH)作为一种严重的神经系统疾病,其精准识别与分类对临床诊疗具有关键意义。由阿德莱德大学机器学习研究所与弗林德斯大学健康医学研究院联合开发的脑出血分割数据集(BHSD),于2023年正式发布,旨在填补多类别颅内出血分割领域公共数据资源的空白。该数据集基于北美放射学会(RSNA)提供的原始CT影像,通过专业医学影像专家团队进行像素级标注,涵盖了硬膜外出血、脑实质内出血、脑室内出血、蛛网膜下腔出血及硬膜下出血五大类别,共包含192例三维容积数据与2200例切片级标注数据。BHSD的构建不仅推动了深度学习在医学图像分析中的应用深化,更为多类别分割算法的研发与评估提供了标准化基准,显著提升了颅内出血自动化诊断工具的开发效率与临床转化潜力。
当前挑战
在颅内出血分割领域,多类别精准分割面临诸多挑战:不同出血类型在CT影像中呈现形态、密度及空间分布的显著异质性,且常存在多类别共存现象,导致模型难以准确区分边界模糊或体积较小的病灶。此外,各类别数据分布极不均衡,如硬膜外出血样本稀缺,严重影响模型对少数类别的识别性能。在数据集构建过程中,挑战主要集中于三维影像重建与高质量标注的实现:原始DICOM格式数据需依据几何信息重建为连贯的三维容积,并映射切片级标签;像素级标注依赖多名医学影像专家耗时耗力的手动分割与交叉校验,而标注一致性保障与罕见类别样本的筛选亦增加了构建复杂度。这些挑战共同制约了多类别分割模型的泛化能力与临床实用性。
常用场景
经典使用场景
在神经影像分析领域,脑出血的精确识别与分类对临床诊断至关重要。BHSD数据集作为首个提供三维多类别颅内出血像素级标注的公开资源,其经典使用场景在于支持深度学习模型进行多类别语义分割任务。研究者利用该数据集训练和验证模型,以自动分割出硬膜外出血、脑实质内出血、脑室内出血、蛛网膜下腔出血和硬膜下出血等五类出血区域,从而实现对出血类型、位置和体积的精准量化分析。
解决学术问题
BHSD数据集有效解决了颅内出血影像分析中多类别分割数据匮乏的学术难题。以往公开数据集多局限于出血分类或单类别分割,难以支持针对不同出血类型的精细化研究。该数据集通过提供192例像素级标注和2200例切片级标注的三维CT扫描,使学者能够开发并评估多类别分割算法,推动模型在复杂出血形态、密度差异及多类型共存情况下的性能提升,为计算机辅助诊断系统的优化奠定数据基础。
实际应用
在实际临床应用中,BHSD数据集为开发自动化脑出血诊断工具提供了关键支持。基于该数据集训练的模型可集成至医院影像系统中,辅助放射科医生快速识别和分类出血类型,缩短诊断时间,减少人为误差。此外,模型输出的分割结果有助于量化出血体积,为治疗方案制定、预后评估及手术规划提供客观依据,提升颅内出血管理的效率和精准度,尤其在急诊和重症监护场景中具有显著价值。
数据集最近研究
最新研究方向
在颅内出血影像分析领域,BHSD数据集的推出为多类别分割任务提供了关键支持,推动了前沿研究向精细化与半监督学习方向演进。当前研究聚焦于利用该数据集探索三维深度学习模型在复杂出血类型识别中的性能优化,特别是针对罕见类别如硬膜外血肿的细分策略。同时,结合大量未标注数据,半监督方法如交叉伪监督技术展现出提升模型泛化能力的潜力,这为临床环境中有限标注资源的利用开辟了新路径。这些进展不仅强化了计算机辅助诊断工具的准确性,也为出血性卒中的个性化治疗规划奠定了技术基础。
相关研究论文
  • 1
    BHSD: A 3D Multi-Class Brain Hemorrhage Segmentation Dataset澳大利亚机器学习研究所,阿德莱德大学 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作