five

WuBiao/BHSD|医学图像分割数据集|脑出血数据集

收藏
hugging_face2024-05-19 更新2024-06-12 收录
医学图像分割
脑出血
下载链接:
https://hf-mirror.com/datasets/WuBiao/BHSD
下载链接
链接失效反馈
资源简介:
Brain Hemorrhage Segmentation Dataset (BHSD) 是一个用于颅内出血(ICH)的三维多类分割数据集。颅内出血是一种病理状况,其特征是颅骨或大脑内出血,可能由多种因素引起。准确识别、定位和量化ICH对于临床诊断和治疗至关重要。我们的数据集包含192个带有像素级标注的卷和1980个未标注的卷,涵盖了五种ICH类别。

Brain Hemorrhage Segmentation Dataset (BHSD) 是一个用于颅内出血(ICH)的三维多类分割数据集。颅内出血是一种病理状况,其特征是颅骨或大脑内出血,可能由多种因素引起。准确识别、定位和量化ICH对于临床诊断和治疗至关重要。我们的数据集包含192个带有像素级标注的卷和1980个未标注的卷,涵盖了五种ICH类别。
提供机构:
WuBiao
原始信息汇总

Brain Hemorrhage Segmentation Dataset (BHSD)

描述

Brain Hemorrhage Segmentation Dataset (BHSD) 是一个用于颅内出血(ICH)的3D多类分割数据集。颅内出血是一种病理状况,其特点是颅骨或脑内出血,可能由多种因素引起。准确识别、定位和量化ICH对于临床诊断和治疗至关重要。我们的数据集包含192个带有像素级标注的体积和1980个未标注的体积,涵盖五类ICH。

数据内容

该数据集包括以下两个压缩文件:

  • label_192.zip: 包含192个带有像素级标注的体积(文件需要以nii.gz为后缀)。
    • 可直接下载:wget https://huggingface.co/datasets/WuBiao/BHSD/resolve/main/label_192.zip
  • unlabel_1980.zip: 包含1980个未标注的重建数据体积。
    • 可直接下载:wget https://huggingface.co/datasets/WuBiao/BHSD/resolve/main/unlabel_1980.zip

应用

该数据集主要用于支持深度学习技术在医学图像分割任务中的应用,特别是多类颅内出血分割。它可用于监督和半监督的ICH分割任务,并提供了最先进模型的实验结果作为参考基准。

数据格式

所有体积数据均存储在常用的医学影像格式中(如DICOM、NIFTI)。

访问和使用

该数据集现已公开可用,并正在最新的MICCAI竞赛中使用。有兴趣使用该数据集的研究人员可以下载并必须遵守相关的使用条款和版权信息。

版权和许可

该数据集受版权法保护。请在使用前确保遵守相关许可条款。

联系信息

如需更多信息或申请访问数据集,请联系我们:

  • 邮箱:biaowu165534@gmail.com
AI搜集汇总
数据集介绍
main_image_url
构建方式
BHSD数据集专注于颅内出血(ICH)的三维多类别分割任务,旨在为临床诊断和治疗提供精确的定位与量化支持。该数据集通过收集192个带有像素级标注的3D体积数据,以及1980个未标注的重建数据,构建了一个全面的ICH分割基准。数据以NIFTI格式存储,确保了与医学影像处理工具的兼容性。
特点
BHSD数据集的核心特点在于其多类别分割能力,涵盖了五种颅内出血类型,为深度学习模型提供了丰富的训练和验证数据。数据集不仅包含标注数据,还提供了大量未标注数据,支持半监督学习任务。此外,数据集的公开性和与MICCAI竞赛的结合,进一步推动了其在医学影像分割领域的研究与应用。
使用方法
BHSD数据集适用于深度学习技术在医学图像分割任务中的应用,特别是颅内出血的多类别分割。研究人员可通过HuggingFace平台直接下载数据集,并利用其进行监督或半监督学习实验。数据集的使用需遵守相关版权和许可条款,确保合法合规。
背景与挑战
背景概述
脑出血分割数据集(Brain Hemorrhage Segmentation Dataset, BHSD)由WuBiao团队创建,旨在为颅内出血(Intracranial Hemorrhage, ICH)的多类别分割任务提供高质量的三维医学影像数据。颅内出血是一种严重的病理状态,通常由多种因素引发,其准确的识别、定位和量化对临床诊断和治疗至关重要。该数据集包含192个带有像素级标注的影像数据以及1980个未标注的重建数据,涵盖了五种不同的ICH类别。BHSD的发布为深度学习在医学影像分割领域的应用提供了重要支持,尤其是在多类别分割任务中,推动了相关算法的研究与优化。
当前挑战
BHSD数据集在解决颅内出血分割问题时面临多重挑战。首先,颅内出血的形态多样且边界模糊,导致分割任务在精度和鲁棒性上要求极高。其次,医学影像数据的获取和标注成本高昂,且需要专业医生的参与,这使得数据集的构建过程复杂且耗时。此外,未标注数据的利用也带来了半监督学习中的挑战,如何有效利用这些数据提升模型性能仍是一个开放性问题。最后,医学影像数据的隐私性和敏感性要求数据的使用和共享必须严格遵守相关法律法规,这也增加了数据集的访问和使用难度。
常用场景
经典使用场景
在医学影像分析领域,BHSD数据集被广泛应用于颅内出血(ICH)的多类别分割任务。通过提供192个带有像素级标注的3D体积数据和1980个未标注的重建数据,该数据集为深度学习模型提供了丰富的训练和验证资源。研究人员可以利用这些数据进行监督学习和半监督学习,以提升模型在复杂医学影像中的分割精度。
解决学术问题
BHSD数据集解决了颅内出血自动分割中的关键问题,如多类别出血区域的精确识别与量化。传统方法依赖于手工特征提取,难以应对复杂多变的出血形态。该数据集通过提供高质量的标注数据,支持深度学习模型在出血区域的自动分割与分类,显著提升了分割的准确性和鲁棒性,为临床诊断和治疗提供了可靠的技术支持。
衍生相关工作
基于BHSD数据集,许多经典研究工作得以展开。例如,研究人员开发了多种基于深度学习的多类别分割模型,如U-Net的变体和Transformer架构,这些模型在MICCAI竞赛中取得了优异的成绩。此外,该数据集还推动了半监督学习和自监督学习在医学影像分割中的应用,为相关领域的研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。

arXiv 收录