jherng/rsna-2023-abdominal-trauma-detection
收藏数据集卡片 RSNA 2023 腹部创伤检测(预处理)
数据集描述
数据集概述
该数据集是RSNA 2023 腹部创伤检测 Kaggle 竞赛的预处理版本,适用于分割和分类任务。包含三种不同的配置:
- classification:
- 4711 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、目标标签及其相关元数据。
- segmentation:
- 206 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、一个 NIfTI 格式的分割掩码及其相关元数据。
- classification-with-mask:
- 206 个实例,每个实例包括一个 NIfTI 格式的 CT 扫描、一个 NIfTI 格式的分割掩码、目标标签及其相关元数据。
所有 CT 扫描和分割掩码已预先重采样,体素间距为 (2.0, 2.0, 3.0),因此文件大小已减小。
数据结构
数据实例
配置 1: classification
- 下载的数据集文件大小: 90.09 GiB
一个 classification 配置的实例示例如下:
json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/25899/21872.nii.gz", "bowel": 0, "extravasation": 0, "kidney": 0, "liver": 0, "spleen": 0, "any_injury": false, "metadata": { "series_id": 21872, "patient_id": 25899, "incomplete_organ": false, "aortic_hu": 113.0, "pixel_representation": 0, "bits_allocated": 16, "bits_stored": 12 } }
配置 2: segmentation
- 下载的数据集文件大小: 3.91 GiB
一个 segmentation 配置的实例示例如下:
json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/4791/4622.nii.gz", "seg_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/segmentations/4622.nii.gz", "metadata": { "series_id": 4622, "patient_id": 4791, "incomplete_organ": false, "aortic_hu": 223.0, "pixel_representation": 1, "bits_allocated": 16, "bits_stored": 16 } }
配置 3: classification-with-mask
- 下载的数据集文件大小: 3.91 GiB
一个 classification-with-mask 配置的实例示例如下:
json { "img_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/train_images/4791/4622.nii.gz", "seg_path": "https://huggingface.co/datasets/jherng/rsna-2023-abdominal-trauma-detection/resolve/main/segmentations/4622.nii.gz", "bowel": 0, "extravasation": 0, "kidney": 0, "liver": 1, "spleen": 1, "any_injury": true, "metadata": { "series_id": 4622, "patient_id": 4791, "incomplete_organ": false, "aortic_hu": 223.0, "pixel_representation": 1, "bits_allocated": 16, "bits_stored": 16 } }
数据字段
所有配置的数据字段如下:
img_path: 表示 NIfTI 格式 CT 扫描路径的字符串特征。seg_path: 表示 NIfTI 格式分割掩码路径的字符串特征(仅适用于 segmentation 和 classification-with-mask 配置)。bowel,extravasation,kidney,liver,spleen: 表示相应器官状况的类别标签特征。any_injury: 表示是否存在任何损伤的布尔特征。metadata: 包含元数据信息的字典特征,包含以下字段:series_id: 整数特征。patient_id: 整数特征。incomplete_organ: 布尔特征。aortic_hu: 浮点数特征。pixel_representation: 整数特征。bits_allocated: 整数特征。bits_stored: 整数特征。
数据分割
默认分割比例:
- 0.9:0.1,随机种子为 42
| 配置名称 | 训练样本数 | 测试样本数 |
|---|---|---|
| classification | 4239 | 472 |
| segmentation | 185 | 21 |
| classification-with-mask | 185 | 21 |
修改分割比例:
python rsna_ds = load_dataset("jherng/rsna-2023-abdominal-trauma-detection", "classification", test_size=0.05, random_state=42)
附加信息
引用信息
- 预处理数据集:
@InProceedings{huggingface:dataset, title = {RSNA 2023 Abdominal Trauma Detection Dataset (Preprocessed)}, author={Hong Jia Herng}, year={2023} }
- 原始数据集:
@misc{rsna-2023-abdominal-trauma-detection, author = {Errol Colak, Hui-Ming Lin, Robyn Ball, Melissa Davis, Adam Flanders, Sabeena Jalal, Kirti Magudia, Brett Marinelli, Savvas Nicolaou, Luciano Prevedello, Jeff Rudie, George Shih, Maryam Vazirabad, John Mongan}, title = {RSNA 2023 Abdominal Trauma Detection}, publisher = {Kaggle}, year = {2023}, url = {https://kaggle.com/competitions/rsna-2023-abdominal-trauma-detection} }




