Euniceyeee/kidney-ct-abnormality
收藏Kidney-CT-Abnormality 数据集概述
数据集描述
Kidney-CT-Abnormality 数据集包含带有异常标签的肾脏CT扫描图像。该数据集由986个.mha(医学高分辨率图像)文件组成,这些文件都是3D医学图像,包含多层图像,有助于精确分类。此外,还包含一个.json文件,说明每个图像的异常状态。
数据集来源
该数据集是从“Dataset for: Kidney abnormality segmentation in thorax-abdomen CT scans”(https://zenodo.org/records/8014290)重建而来,以适应2023年自动化通用分类挑战(AUC2023)。
数据集用途
该数据集旨在用于肾脏异常分类任务。
直接用途
通过加载该数据集,可以输出转换后的图像(numpy数组dtype=uint32,已分解为图像序列而非多层图像)、原始图像路径(加载后的numpy数组dtype=float64)和图像标签,从而进行各种分类任务。
非适用用途
该数据集不能用于分割任务,因为没有包含地面实况图像。
数据集初始处理
- 训练-测试分割:创建了训练-测试分割以适应进一步的分类任务。图像随机分配到训练/测试文件夹。
- 元数据修改:原始json文件包含其他信息,如简要描述和许可证。仅保留图像文件名和相应的标签(正常:0,异常:1),并添加了训练-测试分割信息。注意,原始文件名与图像文件名(格式问题)不匹配,因此也进行了修改。
数据集结构
- 图像数据:
- kidney_CT
- kidney_CT.zip
- train
- kidneyabnormalityKiTS-xxxx_0000.mha(KiTS可替换为RUMC,xxxx为四位数字,表示图像编号)
- test
- kidneyabnormalityKiTS-xxxx_0000.mha(KiTS可替换为RUMC,xxxx为四位数字,表示图像编号)
- train
- kidney_CT.zip
- kidney_CT
- 元数据:
- dataset_m.json
- {"image":"kidneyabnormalityKiTS-0000_0000.mha","split":"train","abnormality":0}
- dataset_m.json
数据集创建
创建理由
肾脏疾病通常存在显著的检测挑战,但其及时识别和诊断对于有效治疗至关重要。Kidney-CT-Abnormality数据集旨在促进开发先进的人工智能(AI)和机器学习算法,以提高肾脏疾病的识别和诊断准确性。
源数据
该数据集的原始主页:https://zenodo.org/records/8043408 原始数据集包含“215个胸腹部CT扫描图像,带有肾脏和肾脏异常的分割”。注意,原始数据集总共包含38.4G的mha格式图像数据,并且没有指示异常状态的.json文件。相反,包含了一个肾脏图像分割数据集。
注释
异常标签的注释信息由原始作者完成,并包含在json文件中。
个人和敏感信息
CT扫描图像文件名包含研究ID,指示扫描的差异。这些ID是匿名的,不包含任何其他个人信息。
偏差、风险和限制
该数据集仅包含异常标签,没有进一步的特定疾病信息。这可能限制算法的诊断特异性。此外,收集的数据可能存在潜在偏差,例如CT扫描可能来自特定人群,这可能引入偏差(扭曲数据的代表性和适用性)。
建议
用户应了解数据集的风险、偏差和技术限制。需要更多信息以提供进一步的建议。
引用
Alves, N., & Boulogne, L. (2023). Kidney CT Abnormality [Data set]. Zenodo. https://doi.org/10.5281/zenodo.8043408 Gabriel E. Humpire-Mamani, Luc Builtjes, Colin Jacobs, Bram van Ginneken, Mathias Prokop, & Ernst Th. Scholten. (2023). Dataset for: Kidney abnormality segmentation in thorax-abdomen CT scans [Data set]. Zenodo. https://doi.org/10.5281/zenodo.8014290



