natealberti/ChestX-Det
收藏Hugging Face2024-03-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/natealberti/ChestX-Det
下载链接
链接失效反馈官方服务:
资源简介:
ChestX-Det是一个包含实例级标注(框和掩码)的胸部X光数据集,是NIH ChestX-ray14公共数据集的子集。数据集包含约3500张图像,涵盖了13种常见疾病类别,并由三位认证的放射科医生进行标注。此外,为数据集中的每张图像创建了分割掩码,并将每张图像映射到唯一的RGB值。
ChestX-Det是一个包含实例级标注(框和掩码)的胸部X光数据集,是NIH ChestX-ray14公共数据集的子集。数据集包含约3500张图像,涵盖了13种常见疾病类别,并由三位认证的放射科医生进行标注。此外,为数据集中的每张图像创建了分割掩码,并将每张图像映射到唯一的RGB值。
提供机构:
natealberti
原始信息汇总
数据集概述
数据集信息
- 特征:
image: 图像数据mask: 图像数据label: 图像数据
- 分割:
train: 训练集,包含3025个样本,大小为1269680775.5字节test: 测试集,包含553个样本,大小为229042164.0字节
- 下载大小: 1464680989字节
- 数据集大小: 1498722939.5字节
配置
- 默认配置:
train: 路径为data/train-*test: 路径为data/test-*
数据集描述
ChestX-Det是一个胸部X光数据集,包含实例级别的标注(框和掩码)。它是公开数据集NIH ChestX-ray14的一个子集,包含约3500张图像,涵盖13种常见疾病类别,由三位持牌放射科医生标注。每个图像都映射到一个唯一的RGB值。
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,高质量的标注数据对于模型训练至关重要。ChestX-Det数据集源自公开的NIH ChestX-ray14数据集,经过精心筛选与标注构建而成。该数据集包含约3500张胸部X光图像,覆盖13种常见疾病类别。每张图像均由三位获得认证的放射科医师进行实例级标注,包括边界框和分割掩码,确保了标注的准确性与权威性。图像与掩码通过唯一的RGB值进行映射,便于后续处理与分析。
特点
ChestX-Det数据集以其精细的实例级标注而著称,为胸部X光影像的疾病检测提供了丰富的信息。数据集包含3025张训练图像和553张测试图像,总计约3500张样本,涵盖了肺炎、肺结节等13类常见胸部疾病。每张图像均配有高质量的分割掩码,能够精确标识病变区域,支持像素级分析。这种结构化的标注方式不仅提升了数据的可用性,还为深度学习模型在医学影像分割与检测任务中的性能评估提供了可靠基准。
使用方法
该数据集适用于胸部X光影像的疾病检测与分割任务,用户可通过HuggingFace平台直接下载使用。数据集已划分为训练集和测试集,便于模型训练与验证。在使用时,可加载图像及其对应的掩码与标签,结合深度学习框架如PyTorch或TensorFlow进行模型开发。掩码以RGB图像格式提供,需根据映射关系解析为类别信息。参考Deepwise AILab的GitHub仓库可获得更多技术细节,助力研究人员在医学影像分析领域取得进展。
背景与挑战
背景概述
在医学影像分析领域,胸部X光片作为诊断肺部疾病的关键工具,其自动化分析技术的研究一直备受关注。ChestX-Det数据集由Deepwise AILab的研究团队于近年创建,基于公开数据集NIH ChestX-ray14构建,旨在推动胸部X光图像中疾病实例的检测与分割研究。该数据集包含约3500张图像,覆盖13种常见疾病类别,并由三位认证放射科医师进行实例级标注(包括边界框和掩码),为深度学习模型在精准定位病灶区域提供了高质量基准,显著促进了计算机辅助诊断系统的发展。
当前挑战
ChestX-Det数据集致力于解决胸部X光图像中多疾病实例的检测与分割问题,其核心挑战在于病灶区域的形态多样性和图像背景的复杂性,这要求模型具备强大的特征区分能力以准确识别细微病变。在构建过程中,数据标注面临严峻考验:由于医学影像的专业性,需依赖多位放射科医师进行精细的实例级标注,以确保边界框和掩码的准确性,同时处理原始数据中的噪声和不一致性,这些因素共同增加了数据集创建的难度与成本。
常用场景
经典使用场景
在医学影像分析领域,ChestX-Det数据集以其精细的实例级标注而著称,为胸部X光图像的疾病检测与分割提供了关键支持。该数据集常用于训练和评估深度学习模型,特别是针对卷积神经网络在目标检测和语义分割任务中的性能验证。通过提供带有边界框和掩码标注的图像,研究者能够系统性地探索模型在识别肺炎、结节等13种常见胸部疾病时的准确性与鲁棒性,从而推动自动化诊断工具的发展。
解决学术问题
ChestX-Det数据集有效解决了医学影像研究中标注数据稀缺、标注粒度不足的学术难题。其提供的实例级标注使得模型能够精确区分图像中的多个病灶区域,而非仅进行整体分类,这有助于深入探究疾病的空间分布与形态特征。该数据集的意义在于促进了细粒度视觉分析在放射学中的应用,为多标签检测、病灶定位及分割等前沿研究方向提供了标准化基准,显著提升了学术研究的可重复性与比较性。
衍生相关工作
围绕ChestX-Det数据集,已衍生出多项经典研究工作,例如Deepwise AILab团队开发的基于掩码标注的分割模型,这些工作扩展了数据集的原始用途。后续研究常结合该数据集与NIH ChestX-ray14等大型资源,探索多任务学习、弱监督分割及跨模态融合方法,进一步推动了医学影像人工智能在泛化能力与解释性方面的进展,为相关领域设立了重要的技术参照。
以上内容由遇见数据集搜集并总结生成



