yh0701/FracAtlas_dataset

Hugging Face2024-03-01 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/yh0701/FracAtlas_dataset

下载链接

链接失效反馈

资源简介：

FracAtlas数据集是一个用于骨折分类、定位和分割的肌肉骨骼放射影像集合。它包括4083张X射线图像（其中717张是骨折图像），并提供了多种格式的注释，如COCO、VGG、YOLO和Pascal VOC格式。该数据集旨在用于医学影像中的深度学习任务，特别是针对骨折的理解。数据集在CC-BY 4.0许可下免费提供。

提供机构：

yh0701

原始信息汇总

数据集卡片：FracAtlas

概述

"FracAtlas" 数据集是一个包含用于骨骨折分类、定位和分割的肌肉骨骼放射图像集合。该数据集包含 4,083 张 X 射线图像（其中 717 张为骨折图像），并附有多种格式的相应注释，包括 COCO、VGG、YOLO 和 Pascal VOC 格式。数据集旨在用于医学影像中的深度学习任务，特别是针对骨骨折的理解。

数据集来源

数据集的源数据托管在 Figshare 上，这是一个在线数字存储库，研究人员可以在其中保存和分享他们的研究成果，包括数据集。FracAtlas 数据集根据 CC-BY 4.0 许可证自由访问，允许在科学界广泛使用，特别是在医学影像及相关领域的研究人员和从业者中。

用途

"FracAtlas" 数据集可用于开发多种机器学习或深度学习算法，例如：

开发深度学习模型以自动检测放射图像中的骨折。
使用机器学习模型对骨折类型（如发丝状、复合状、横向）进行分类。
实施分割模型以从放射图像中的周围组织中描绘骨骼结构。
根据骨折特征和其他患者数据预测患者的结果。
开发模型以识别放射图像中骨骼的异常模式。

数据集结构

原始数据集架构

原始 zip 文件包含 3 个子文件夹“images”、“Annotations”、“utilities”和一个“dataset.csv”文件。

images 文件夹：包含“Fractured”和“Non-fractured”两个子文件夹，每个图像以 JPG 格式存储在相应的文件夹中。
Annotations 文件夹：包含“COCO JSON”、“PASCAL VOC”、“VGG JSON”和“YOLO”四个子文件夹，注释存储在相应的文件夹中。
utilities 文件夹：包含多个编程脚本，用于将原始文件转换为更易读的格式。
dataset.csv：包含每个图像的许多基本变量，如 image_id、hand、leg、hip、shoulder、mixed、hardware、multiscan、fractured、fracture_count、frontal、lateral、oblique 等。

更新后的数据集架构

在 Hugging Face 数据集加载器中，从原始“dataset.csv”中提取并修改了某些现有变量，以适应 Huggingface 特征类。其他重要变量从“FracAtlas” zip 文件中的其他下载文件中提取，以呈现更系统化和干净的 FracAtlas 数据集。

数据集创建理由

FracAtlas 数据集的创建是由训练用于骨折检测的机器学习模型的需求驱动的。该数据集旨在填补用于推进 AI 辅助诊断工具的带注释肌肉骨骼放射图像的可用性缺口。

源数据

初始阶段收集了 14,068 张 X 射线图像。由于隐私问题，所有 DICOM 图像都被赋予了一个任意的图像名称并转换为 JPG 图像格式。这些转换使用相应的 X 射线机器的专有软件完成。

注释

数据集包含 4,083 张图像，这些图像已由两名专业放射科医生手动注释，用于骨骨折分类、定位和分割。注释后来由一名整形外科医生使用开源标记平台 makesense.ai 进行验证和合并。注释类型包括 COCO JSON、PASCAL VOC、VGG JSON 和 YOLO。

偏差、风险和限制

尽管 FracAtlas 数据集对于计算机辅助诊断系统的发展特别有价值，但其潜在的限制应仔细考虑。首先，手动注释过程容易受到人为错误的影响，可能导致标签错误。

引用

Abedeen, I., Rahman, M. A., Prottyasha, F. Z., Ahmed, T., Chowdhury, T. M., & Shatabda, S. (2023). FracAtlas: A Dataset for Fracture Classification, Localization and Segmentation of Musculoskeletal Radiographs. Scientific data, 10(1), 521. https://doi.org/10.1038/s41597-023-02432-4

AI搜集汇总

数据集介绍

构建方式

FracAtlas数据集的构建基于对14,068张X射线图像的精心筛选与处理，最终形成了包含4,083张图像的骨科放射影像集合。这些图像主要涵盖手、腿、髋关节和肩部区域，并经过严格的隐私保护措施，将DICOM格式的图像转换为JPG格式，去除了敏感的元数据信息。数据集的构建过程中，特别注重了骨折图像的分类、定位和分割，提供了多种格式的标注，包括COCO、PASCAL VOC、VGG和YOLO，以满足不同深度学习任务的需求。

特点

FracAtlas数据集的显著特点在于其丰富的标注信息和多样化的图像格式，涵盖了骨折分类、定位和分割等多个任务。数据集包含717张骨折图像，并提供了详细的分割、边界框和区域信息，适用于多种医学影像分析任务。此外，数据集还包含了关于图像中是否存在手、腿、髋关节、肩部等部位的二元指示符，以及图像的朝向和是否包含医疗硬件等信息，为模型训练提供了多维度的特征支持。

使用方法

FracAtlas数据集可用于开发多种机器学习和深度学习算法，如自动检测骨折、分类骨折类型、分割骨骼结构等。使用者可以通过Hugging Face的`datasets`加载器轻松获取数据集，并利用提供的图像和标注信息进行模型训练和评估。数据集的结构清晰，标注信息丰富，适合用于医学影像分析领域的研究与应用，特别是骨折检测和诊断相关任务。

背景与挑战

背景概述

FracAtlas数据集是由Iftekharul Abedeen、Md. Ashiqur Rahman等研究人员于2023年创建的，专注于骨科放射影像的骨折分类、定位和分割任务。该数据集包含4,083张X光片，其中717张带有骨折标注，涵盖多种格式（如COCO、VGG、YOLO和Pascal VOC）的详细标注。FracAtlas的构建旨在填补医学影像领域中高质量、标注精细的骨科数据集的空白，推动AI辅助诊断工具的发展，特别是在骨折检测和分类方面。该数据集的发布对医学影像分析领域具有重要意义，为研究人员提供了宝贵的资源，以提升骨折诊断的准确性和效率。

当前挑战

FracAtlas数据集在构建过程中面临多项挑战。首先，数据集的标注过程依赖于人工操作，容易引入误差，导致部分图像的标注不准确。其次，尽管数据集主要针对骨折图像进行标注，但部分非骨折图像也包含标注信息，而某些骨折图像却缺少相应的标注，这可能影响模型的训练效果。此外，数据集中包含多种类型的标注格式，增加了数据处理的复杂性。最后，数据集的使用需要具备医学和放射学领域的专业知识，以正确理解和解释结果，避免因标注错误或理解偏差导致的误判。

常用场景

经典使用场景

FracAtlas数据集在骨科医学影像领域具有广泛的应用场景，尤其在骨折检测、分类和分割任务中表现突出。该数据集包含了4,083张X光片，其中717张带有骨折标注，适用于开发深度学习模型以自动识别骨折。此外，数据集还提供了详细的分割和定位信息，支持构建模型以区分不同类型的骨折（如线性骨折、复合骨折等），并实现骨骼结构的精确分割。

衍生相关工作

FracAtlas数据集的发布催生了一系列相关研究工作，特别是在医学影像分析和骨折检测领域。研究人员利用该数据集开发了多种深度学习模型，用于骨折的自动检测、分类和分割。此外，该数据集还激发了对医学影像标注方法的改进研究，以及对骨折检测算法性能的进一步优化。这些工作不仅提升了骨折诊断的准确性，还为医学影像数据的标注和处理提供了新的思路。

数据集最近研究