five

CheXmask-U

收藏
Hugging Face2025-12-21 更新2025-12-22 收录
下载链接:
https://huggingface.co/datasets/mcosarinsky/CheXmask-U
下载链接
链接失效反馈
官方服务:
资源简介:
CheXmask-U是一个用于基于地标的胸部X光图像解剖分割的数据集,提供解剖地标的每个节点的不确定性估计。数据集以CSV文件形式提供,包含图像ID、Dice相似系数(最大值和平均值)、地标坐标(平均值和标准差)、左右肺和心脏的分割掩码(使用运行长度编码RLE)、以及分割掩码的高度和宽度等字段。
创建时间:
2025-12-11
原始信息汇总

CheXmask-U 数据集概述

数据集基本信息

  • 名称:CheXmask-U
  • 许可证:Apache-2.0
  • 任务类别:图像分割
  • 领域标签:医学、X射线、胸部

数据集描述

CheXmask-U 是一个用于胸部X光图像基于解剖标志点分割的数据集,其核心特点是提供了解剖标志点的逐节点不确定性估计

相关资源链接

  • 论文:https://arxiv.org/abs/2512.10715
  • 代码:https://github.com/mcosarinsky/CheXmask-U
  • 项目页面:https://huggingface.co/spaces/matiasky/CheXmask-U
  • 预训练权重:https://huggingface.co/mcosarinsky/CheXmask-U

数据集内容与结构

数据集以CSV文件格式提供。每一行对应一个胸部X光样本,包含以下字段:

  • 图像ID:根据源数据元数据,指向原始胸部X光图像的引用。
  • Dice RCA (最大值):使用反向分类准确率计算的最大Dice相似系数,用作分割质量指标。
  • Dice RCA (平均值):来自RCA的平均Dice相似系数。
  • 标志点 (平均值):从模型潜在空间采样的多个随机预测中计算出的平均解剖标志点坐标。
  • 标志点 (标准差):标志点坐标的标准差,代表节点级不确定性。
  • 左肺:左肺的分割掩码,使用游程编码进行编码。
  • 右肺:右肺的分割掩码,使用游程编码进行编码。
  • 心脏:心脏的分割掩码,使用游程编码进行编码。
  • 高度:分割掩码的高度,解码RLE掩码所需。
  • 宽度:分割掩码的宽度,解码RLE掩码所需。
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,精准的解剖结构分割对于辅助诊断至关重要。CheXmask-U数据集的构建基于胸部X光图像,通过先进的深度学习模型生成解剖标志点分割结果。该数据集不仅提供了左肺、右肺及心脏的分割掩码,还创新性地引入了基于反向分类准确性的分割质量指标,并通过对模型潜在空间进行多次随机采样,计算出每个解剖标志点的平均坐标及其标准差,从而量化节点级别的不确定性。这种构建方式确保了分割结果的可解释性与可靠性。
使用方法
研究人员可利用CheXmask-U数据集进行医学影像分割模型的开发与验证。数据集以CSV格式提供,用户需根据图像ID关联原始X光图像,并利用高度和宽度信息解码运行长度编码的分割掩码。不确定性估计字段可直接用于模型校准或不确定性感知训练策略的评估。通过结合提供的预训练权重和代码库,用户可以快速复现实验或在此基础上进行迁移学习,推动胸部X光解剖结构分割技术的进步。
背景与挑战
背景概述
在医学影像分析领域,胸部X光图像的精准解剖结构分割对于辅助诊断和疾病量化至关重要。CheXmask-U数据集由相关研究团队于2024年构建并发布,其核心研究目标在于推进基于解剖标志物的胸部X光图像分割技术,并创新性地为每个标志物提供节点级的不确定性量化。该数据集通过整合多模型随机预测的均值坐标及其标准差,不仅标注了左肺、右肺和心脏的分割掩码,还引入了基于反向分类准确性的分割质量指标,为模型可靠性评估提供了新维度,对推动医学影像人工智能向可解释、可信赖的方向发展具有显著影响力。
当前挑战
该数据集致力于解决胸部X光图像解剖结构自动分割这一核心领域问题,其面临的主要挑战在于医学影像固有的高噪声、低对比度特性以及个体间解剖结构的巨大变异,这些因素使得分割边界难以精确界定。在数据集构建过程中,挑战同样突出:如何从模型潜在空间中有效采样以生成可靠的随机预测,并据此计算具有统计意义的坐标均值与标准差;同时,设计并应用反向分类准确性等指标来量化分割质量与不确定性,亦需克服方法学与计算复杂性的双重障碍。
常用场景
经典使用场景
在医学影像分析领域,CheXmask-U数据集为胸部X光图像的解剖结构分割提供了关键支持。其经典使用场景在于训练和评估基于深度学习的语义分割模型,特别是针对左肺、右肺和心脏等关键器官的精确轮廓提取。研究人员利用该数据集提供的分割掩码和地标坐标,能够系统地验证模型在复杂解剖结构识别中的性能,为自动化诊断流程奠定基础。
解决学术问题
该数据集有效解决了医学影像分析中解剖结构分割的不确定性量化难题。通过提供每个地标节点的坐标标准差,CheXmask-U使研究者能够评估模型预测的可靠性,从而在临床决策支持系统中引入置信度度量。这不仅提升了分割结果的可解释性,还为处理图像质量变异、病理遮挡等常见挑战提供了量化依据,推动了鲁棒性医学人工智能模型的发展。
实际应用
在实际临床环境中,CheXmask-U数据集支持开发辅助诊断工具,用于胸部疾病的筛查与监测。例如,基于其分割结果可自动计算心脏胸腔比率等临床指标,辅助评估心脏肥大等病症。同时,不确定性估计功能能让临床医生了解算法输出的可信程度,在肺炎检测、手术规划等场景中实现人机协同决策,提升医疗效率与安全性。
数据集最近研究
最新研究方向
在医学影像分析领域,胸部X光图像的精准解剖结构分割对于辅助诊断至关重要。CheXmask-U数据集通过引入基于解剖标志点的分割方法,并首次提供了节点级的不确定性估计,这标志着该领域正从追求单一分割精度转向关注模型预测的可靠性与可解释性。当前研究热点聚焦于利用此类不确定性信息来增强分割模型的鲁棒性,特别是在处理临床中常见的图像质量变异或病理遮挡等复杂场景时,不确定性估计能够帮助医生评估分割结果的置信度,从而支持更安全的决策。这一方向与医疗人工智能向可信赖、可解释发展的全球趋势紧密相连,为开发下一代智能辅助诊断系统奠定了关键的数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作