five

Euniceyeee/kidney-ct-abnormality

收藏
Hugging Face2024-04-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Euniceyeee/kidney-ct-abnormality
下载链接
链接失效反馈
官方服务:
资源简介:
Kidney-CT-Abnormality数据集包含986个3D肾脏CT扫描图像,每个图像都有异常标签。该数据集适用于肾脏异常分类任务,旨在促进人工智能和机器学习算法在肾脏疾病识别和诊断准确性方面的研究。数据集是从另一个公开数据集重构而来,专门为2023年自动化通用分类挑战(AUC2023)设计。数据集的结构包括训练和测试文件夹,每个文件夹中包含多个.mha格式的图像文件,以及一个包含图像异常状态和分组信息的.json文件。

Kidney-CT-Abnormality数据集包含986个3D肾脏CT扫描图像,每个图像都有异常标签。该数据集适用于肾脏异常分类任务,旨在促进人工智能和机器学习算法在肾脏疾病识别和诊断准确性方面的研究。数据集是从另一个公开数据集重构而来,专门为2023年自动化通用分类挑战(AUC2023)设计。数据集的结构包括训练和测试文件夹,每个文件夹中包含多个.mha格式的图像文件,以及一个包含图像异常状态和分组信息的.json文件。
提供机构:
Euniceyeee
原始信息汇总

Kidney-CT-Abnormality 数据集概述

数据集描述

Kidney-CT-Abnormality 数据集包含带有异常标签的肾脏CT扫描图像。该数据集由986个.mha(医学高分辨率图像)文件组成,这些文件都是3D医学图像,包含多层图像,有助于精确分类。此外,还包含一个.json文件,说明每个图像的异常状态。

数据集来源

该数据集是从“Dataset for: Kidney abnormality segmentation in thorax-abdomen CT scans”(https://zenodo.org/records/8014290)重建而来,以适应2023年自动化通用分类挑战(AUC2023)。

数据集用途

该数据集旨在用于肾脏异常分类任务。

直接用途

通过加载该数据集,可以输出转换后的图像(numpy数组dtype=uint32,已分解为图像序列而非多层图像)、原始图像路径(加载后的numpy数组dtype=float64)和图像标签,从而进行各种分类任务。

非适用用途

该数据集不能用于分割任务,因为没有包含地面实况图像。

数据集初始处理

  • 训练-测试分割:创建了训练-测试分割以适应进一步的分类任务。图像随机分配到训练/测试文件夹。
  • 元数据修改:原始json文件包含其他信息,如简要描述和许可证。仅保留图像文件名和相应的标签(正常:0,异常:1),并添加了训练-测试分割信息。注意,原始文件名与图像文件名(格式问题)不匹配,因此也进行了修改。

数据集结构

  • 图像数据
    • kidney_CT
      • kidney_CT.zip
        • train
          • kidneyabnormalityKiTS-xxxx_0000.mha(KiTS可替换为RUMC,xxxx为四位数字,表示图像编号)
        • test
          • kidneyabnormalityKiTS-xxxx_0000.mha(KiTS可替换为RUMC,xxxx为四位数字,表示图像编号)
  • 元数据
    • dataset_m.json
      • {"image":"kidneyabnormalityKiTS-0000_0000.mha","split":"train","abnormality":0}

数据集创建

创建理由

肾脏疾病通常存在显著的检测挑战,但其及时识别和诊断对于有效治疗至关重要。Kidney-CT-Abnormality数据集旨在促进开发先进的人工智能(AI)和机器学习算法,以提高肾脏疾病的识别和诊断准确性。

源数据

该数据集的原始主页:https://zenodo.org/records/8043408 原始数据集包含“215个胸腹部CT扫描图像,带有肾脏和肾脏异常的分割”。注意,原始数据集总共包含38.4G的mha格式图像数据,并且没有指示异常状态的.json文件。相反,包含了一个肾脏图像分割数据集。

注释

异常标签的注释信息由原始作者完成,并包含在json文件中。

个人和敏感信息

CT扫描图像文件名包含研究ID,指示扫描的差异。这些ID是匿名的,不包含任何其他个人信息。

偏差、风险和限制

该数据集仅包含异常标签,没有进一步的特定疾病信息。这可能限制算法的诊断特异性。此外,收集的数据可能存在潜在偏差,例如CT扫描可能来自特定人群,这可能引入偏差(扭曲数据的代表性和适用性)。

建议

用户应了解数据集的风险、偏差和技术限制。需要更多信息以提供进一步的建议。

引用

Alves, N., & Boulogne, L. (2023). Kidney CT Abnormality [Data set]. Zenodo. https://doi.org/10.5281/zenodo.8043408 Gabriel E. Humpire-Mamani, Luc Builtjes, Colin Jacobs, Bram van Ginneken, Mathias Prokop, & Ernst Th. Scholten. (2023). Dataset for: Kidney abnormality segmentation in thorax-abdomen CT scans [Data set]. Zenodo. https://doi.org/10.5281/zenodo.8014290

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作