ziq/RSNA-ATD2023

Hugging Face2023-08-31 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ziq/RSNA-ATD2023

下载链接

链接失效反馈

官方服务：

资源简介：

RSNA-ATD2023数据集由205个CT扫描系列组成，以`.png`文件格式存储，包含原始图像和原始掩码。该数据集来源于Kaggle的RSNA 2023 Abdominal Trauma Detection竞赛，主要用于图像分割任务。数据集中的标签包括背景、肝脏、脾脏、右肾、左肾和肠道等类别。

The RSNA-ATD2023 dataset comprises 205 CT scan series, stored in .png file format, including raw images and original masks. This dataset is sourced from the Kaggle RSNA 2023 Abdominal Trauma Detection Competition, and is primarily used for image segmentation tasks. The labels in the dataset cover categories such as background, liver, spleen, right kidney, left kidney, and intestine.

提供机构：

ziq

原始信息汇总

数据集概述

基本信息

数据集名称: RSNA-ATD2023
语言: 英语
许可证: MIT
多语言性: 单语种
数据集大小: 10K<n<100K
任务类别: 图像分割
任务ID: 语义分割

数据内容

文件格式: .png
数据类型: CT扫描图像及其对应的原始掩码
数据集组成: 205个CT扫描系列

数据结构

训练集: 包含70291行数据
特征: [patient_id, series_id, frame_id, image, mask]

使用示例

加载数据集: python from datasets import load_dataset data = load_dataset(ziq/RSNA-ATD2023)
训练测试分割: python data = data[train].train_test_split(test_size=0.2) train, test = data[train], data[test]
获取图像和分割掩码: python ids = 3 image, mask = train[ids][image], train[ids][mask]
可视化图像和掩码: python fig = plt.figure(figsize=(16,16)) ax1 = fig.add_subplot(131) plt.axis(off) ax1.imshow(image, cmap=gray) ax2 = fig.add_subplot(132) plt.axis(off) ax2.imshow(mask, cmap=gray) ax3 = fig.add_subplot(133) ax3.imshow(image*np.where(mask>0,1,0), cmap=gray) plt.axis(off) plt.show()
自定义颜色映射: python from matplotlib.colors import ListedColormap, BoundaryNorm colors = [#02020e, #520e6d, #c13a50, #f57d15, #fac62c, #f4f88e] bounds = range(0, len(colors) + 1) cmap, norm = ListedColormap(colors), BoundaryNorm(bounds, len(colors))
绘制分割掩码: python def plot_mask(mask, alpha=1.0): _, ax = plt.subplots() cax = ax.imshow(mask, cmap=cmap, norm=norm, alpha=alpha) cbar = plt.colorbar(cax, cmap=cmap, norm=norm, boundaries=bounds, ticks=bounds) cbar.set_ticks([]) _labels = [""] + labels for i in range(1, len(_labels)): cbar.ax.text(2, -0.5 + i, _labels[i], ha=left, color=colors[i - 1], fontsize=8) plt.axis(off) plt.show()
绘制单个类别: python liver, spleen, right_kidney, left_kidney, bowel = [(mask == i,1,0)[0] * i for i in range(1, len(labels))] plot_mask(liver)

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，高质量的标注数据集对于腹部创伤检测模型的开发至关重要。RSNA-ATD2023数据集源自Kaggle竞赛平台，其构建过程整合了205个CT扫描序列，这些序列以PNG格式存储，包含原始图像及对应的分割掩码。数据集的标注工作由领域专家完成，确保了分割掩码的精确性，涵盖了肝脏、脾脏、左右肾脏及肠道等多个关键腹部器官的语义分割标签。

特点

该数据集专注于腹部创伤的语义分割任务，其核心特点在于提供了高分辨率的CT扫描图像及对应的器官分割掩码。数据规模适中，包含超过7万张图像-掩码对，覆盖了多种腹部器官的精细标注。图像与掩码均以512x512像素的统一尺寸呈现，便于模型输入处理。数据集的单语性（英文）与清晰的标签体系，为研究者提供了结构化的实验基础。

使用方法

利用Hugging Face的datasets库，研究者可便捷加载该数据集。加载后，数据集以字典形式呈现，包含患者ID、序列ID、图像及掩码等特征。通过简单的Python代码，即可实现训练集与测试集的划分，并提取图像与对应的分割掩码进行可视化或模型训练。掩码可转换为NumPy数组，并支持自定义色彩映射进行器官类别的可视化展示，便于模型调试与结果分析。

背景与挑战

背景概述

在医学影像分析领域，腹部创伤的精准检测与器官分割对于临床诊断与治疗规划具有至关重要的意义。RSNA-ATD2023数据集源自2023年北美放射学会（RSNA）举办的腹部创伤检测竞赛，由竞赛组织者及相关研究机构共同构建，旨在推动基于CT影像的腹部器官自动分割技术发展。该数据集聚焦于解决腹部创伤背景下多器官语义分割的核心研究问题，涵盖了肝脏、脾脏、双肾及肠道等关键解剖结构的标注数据，为深度学习模型在急重症医学影像分析中的应用提供了重要基准，显著促进了计算机辅助诊断系统在创伤救治中的研究进展。

当前挑战

该数据集致力于应对腹部CT影像中多器官语义分割的挑战，其难点在于创伤情境下器官形态变异、边界模糊以及损伤区域与正常组织的对比度降低，这些因素均增加了自动化分割的复杂性。在构建过程中，数据采集面临标注一致性难题，由于腹部器官结构复杂且个体差异显著，需要放射学专家进行精细且耗时的掩膜标注，以确保标签的准确性与可靠性。此外，数据规模相对有限，且创伤案例的病理多样性可能影响模型的泛化能力，这些因素共同构成了数据集在推动鲁棒分割算法发展中的主要障碍。

常用场景

经典使用场景

在医学影像分析领域，RSNA-ATD2023数据集为腹部创伤检测提供了关键支持。该数据集包含205个CT扫描序列的原始图像与分割掩码，覆盖肝脏、脾脏、肾脏及肠道等关键器官。研究者通常利用其进行语义分割模型的训练与验证，通过像素级标注实现腹部器官的精准定位与损伤评估，为自动化诊断系统奠定数据基础。

解决学术问题

该数据集有效应对了腹部创伤影像分析中标注数据稀缺的挑战。通过提供高质量的分割掩码，它助力解决多器官同步分割、微小损伤识别以及异质性影像特征提取等核心学术问题。其结构化标注体系推动了弱监督学习、跨模态融合等前沿方法的发展，显著提升了医学影像分割任务的可靠性与泛化能力。

衍生相关工作

围绕该数据集已衍生出多项经典研究工作，包括基于U-Net变体的多器官分割架构、结合注意力机制的损伤区域增强模型，以及利用生成对抗网络进行数据扩充的策略。这些成果进一步推动了如nnU-Net、TransUNet等通用分割框架在腹部影像领域的优化与应用，形成了持续迭代的研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集