five

jherng/rsna-2023-abdominal-trauma-detection

收藏
Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jherng/rsna-2023-abdominal-trauma-detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是RSNA 2023 Abdominal Trauma Detection Kaggle竞赛数据集的预处理版本,专为分割和分类任务设计。数据集包含三种配置:classification、segmentation和classification-with-mask。classification配置包含4711个实例,每个实例包括CT扫描图像、目标标签和元数据;segmentation配置包含206个实例,每个实例包括CT扫描图像、分割掩码和元数据;classification-with-mask配置包含206个实例,每个实例包括CT扫描图像、分割掩码、目标标签和元数据。所有CT扫描和分割掩码均已重采样,以减少文件大小。

This dataset is a preprocessed variant of the RSNA 2023 Abdominal Trauma Detection Kaggle Competition dataset, specifically designed for medical image segmentation and classification tasks. The dataset encompasses three configurations: classification, segmentation, and classification-with-mask. The classification configuration comprises 4711 instances, each containing CT scan images, target labels and metadata. The segmentation configuration includes 206 instances, each consisting of CT scan images, segmentation masks and metadata. The classification-with-mask configuration contains 206 instances, each featuring CT scan images, segmentation masks, target labels and metadata. All CT scans and segmentation masks have been resampled to minimize file size.
提供机构:
jherng
原始信息汇总

数据集卡片 RSNA 2023 腹部创伤检测(预处理)

数据集描述

数据集概述

该数据集是RSNA 2023 腹部创伤检测 Kaggle 竞赛的预处理版本,适用于分割和分类任务。包含三种不同的配置:

  • classification:
    • 4711 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、目标标签及其相关元数据。
  • segmentation:
    • 206 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、一个 NIfTI 格式的分割掩码及其相关元数据。
  • classification-with-mask:
    • 206 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、一个 NIfTI 格式的分割掩码、目标标签及其相关元数据。

所有 CT 扫描和分割掩码已预先重采样,体素间距为 (2.0, 2.0, 3.0),因此文件大小已减小。

数据结构

数据实例

配置 1: classification
  • 下载的数据集文件大小: 90.09 GiB

一个 classification 配置的实例示例如下:

json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/25899/21872.nii.gz", "bowel": 0, "extravasation": 0, "kidney": 0, "liver": 0, "spleen": 0, "any_injury": false, "metadata": { "series_id": 21872, "patient_id": 25899, "incomplete_organ": false, "aortic_hu": 113.0, "pixel_representation": 0, "bits_allocated": 16, "bits_stored": 12 } }

配置 2: segmentation
  • 下载的数据集文件大小: 3.91 GiB

一个 segmentation 配置的实例示例如下:

json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/4791/4622.nii.gz", "seg_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/segmentations/4622.nii.gz", "metadata": { "series_id": 4622, "patient_id": 4791, "incomplete_organ": false, "aortic_hu": 223.0, "pixel_representation": 1, "bits_allocated": 16, "bits_stored": 16 } }

配置 3: classification-with-mask
  • 下载的数据集文件大小: 3.91 GiB

一个 classification-with-mask 配置的实例示例如下:

json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/4791/4622.nii.gz", "seg_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/segmentations/4622.nii.gz", "bowel": 0, "extravasation": 0, "kidney": 0, "liver": 1, "spleen": 1, "any_injury": true, "metadata": { "series_id": 4622, "patient_id": 4791, "incomplete_organ": false, "aortic_hu": 223.0, "pixel_representation": 1, "bits_allocated": 16, "bits_stored": 16 } }

数据字段

所有配置的数据字段如下:

  • img_path: 表示 NIfTI 格式 CT 扫描路径的字符串特征。
  • seg_path: 表示 NIfTI 格式分割掩码路径的字符串特征(仅适用于 segmentation 和 classification-with-mask 配置)。
  • bowel, extravasation, kidney, liver, spleen: 表示相应器官状况的类别标签特征。
  • any_injury: 表示是否存在任何损伤的布尔特征。
  • metadata: 包含元数据信息的字典特征,包含以下字段:
    • series_id: 整数特征。
    • patient_id: 整数特征。
    • incomplete_organ: 布尔特征。
    • aortic_hu: 浮点数特征。
    • pixel_representation: 整数特征。
    • bits_allocated: 整数特征。
    • bits_stored: 整数特征。

数据分割

默认分割比例:

  • 0.9:0.1,随机种子为 42
配置名称 训练样本数 测试样本数
classification 4239 472
segmentation 185 21
classification-with-mask 185 21

修改分割比例:

python rsna_ds = load_dataset("jherng/rsna-2023-abdominal-trauma-detection", "classification", test_size=0.05, random_state=42)

附加信息

引用信息

  • 预处理数据集:

@InProceedings{huggingface:dataset, title = {RSNA 2023 Abdominal Trauma Detection Dataset (Preprocessed)}, author={Hong Jia Herng}, year={2023} }

  • 原始数据集:

@misc{rsna-2023-abdominal-trauma-detection, author = {Errol Colak, Hui-Ming Lin, Robyn Ball, Melissa Davis, Adam Flanders, Sabeena Jalal, Kirti Magudia, Brett Marinelli, Savvas Nicolaou, Luciano Prevedello, Jeff Rudie, George Shih, Maryam Vazirabad, John Mongan}, title = {RSNA 2023 Abdominal Trauma Detection}, publisher = {Kaggle}, year = {2023}, url = {https://kaggle.com/competitions/rsna-2023-abdominal-trauma-detection} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建采用了对来自RSNA 2023腹部创伤检测Kaggle竞赛的原始数据集进行预处理的方式。所有CT扫描和分割掩码都已被重新采样,并具有相同的体素间距(2.0, 2.0, 3.0),从而减小了文件大小。数据集分为三种配置,分别为分类、分割和分类带掩码。
特点
数据集的主要特点包括包含CT扫描和分割掩码的NIfTI格式文件,以及相关的目标标签和元数据。此外,数据集已经过预处理,所有CT扫描和分割掩码都已被重新采样,具有相同的体素间距,并减小了文件大小。
使用方法
使用该数据集的方法包括使用Hugging Face的`load_dataset`函数加载数据集,可以选择不同的配置和分割方式。此外,可以通过设置`streaming`参数来控制数据集的下载方式,以及通过设置`num_proc`参数来加速下载过程。
背景与挑战
背景概述
在医学影像分析领域,腹部创伤检测是诊断的关键环节。RSNA 2023 Abdominal Trauma Detection 数据集是由香港中文大学医学院的研究团队于2023年创建的,旨在通过深度学习技术提高腹部创伤检测的准确性和效率。该数据集基于RSNA 2023 Kaggle比赛的数据,经过预处理,包含了腹部CT扫描图像及其对应的分割掩膜和标签。数据集涵盖了肠道、外渗、肾脏、肝脏和脾脏等器官的健康、低度损伤和高度损伤状态,以及是否存在任何损伤的布尔值。数据集的创建为研究人员和开发者提供了宝贵的资源,有助于推动腹部创伤检测技术的进步。
当前挑战
RSNA 2023 Abdominal Trauma Detection 数据集面临着一些挑战。首先,在所解决的领域问题方面,腹部创伤检测的准确性受到图像质量和噪声的干扰。其次,构建过程中,数据集的标注需要由专业的放射科医生进行,以确保数据的准确性和可靠性。此外,数据集的规模和多样性也对模型的泛化能力提出了挑战。为了应对这些挑战,研究人员需要开发更先进的算法,提高模型的鲁棒性和泛化能力,并确保数据的质量和完整性。
常用场景
经典使用场景
该数据集RSNA 2023 Abdominal Trauma Detection被广泛应用于医学影像分析领域,特别是腹部创伤检测。通过CT扫描图像,该数据集能够训练模型对肠道、肾脏、肝脏和脾脏的损伤情况进行分类和分割。数据集包含了详细的器官损伤标签,使得研究人员能够进行精确的模型训练和评估。
衍生相关工作
基于该数据集,研究人员已经取得了一系列相关成果。例如,开发出高性能的腹部创伤检测模型,提高了诊断的准确性和效率。此外,该数据集还被用于医学影像分析领域的研究,如器官分割和损伤识别等。这些成果对于医学研究和临床实践具有重要的意义,有助于推动医学影像分析技术的发展和进步。
数据集最近研究
最新研究方向
在医学影像分析领域,特别是腹部创伤检测方面,最新的研究方向聚焦于利用深度学习技术实现高精度、高效率的影像识别和分割。RSNA 2023 Abdominal Trauma Detection 数据集为这一领域的研究提供了丰富的资源。研究人员正在探索如何利用该数据集来训练和验证模型,以准确识别腹部器官的创伤,包括肠道、肾、肝和脾等。此外,研究还关注如何将分割信息与分类任务相结合,提高诊断的准确性和效率。同时,如何优化模型训练过程,减少计算资源消耗,也是当前研究的热点问题。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作