Hopkins RFOs Bench
收藏arXiv2025-07-09 更新2025-07-11 收录
下载链接:
https://github.com/YuliWanghust/RFO_Bench
下载链接
链接失效反馈官方服务:
资源简介:
Hopkins RFOs Bench数据集是首个也是最大的此类数据集,包含144张胸部X光片,均为约翰霍普金斯卫生系统在过去18年中收集的含有重要外来物体的病例。该数据集旨在解决现有数据集缺乏重要外来物体病例的问题,并为开发能够可靠检测胸部X光片中重要外来物体的AI驱动解决方案提供基础。数据集包括胸部X光片、图像级别标签和对象级别标签,其中对象级别标签使用多边形或边界框对RFOs对象进行标注,并将其分类为非关键或关键。数据集还包括无RFOs病例和非关键RFOs病例,以构建类别平衡的数据集。
The Hopkins RFOs Bench dataset is the first and largest of its kind, containing 144 chest X-ray scans from cases with clinically significant radiopaque foreign objects (RFOs) collected by the Johns Hopkins Health System over the past 18 years. This dataset is designed to address the shortage of such cases in existing datasets, and serve as a foundational resource for developing AI-powered solutions that can reliably detect RFOs in chest X-rays. The dataset comprises chest X-ray images, image-level labels, and object-level labels. For object-level annotations, RFOs are labeled using polygons or bounding boxes and categorized as either non-critical or critical. Additionally, the dataset includes cases without RFOs and cases with non-critical RFOs to construct a class-balanced dataset.
提供机构:
约翰霍普金斯大学
创建时间:
2025-07-09
原始信息汇总
数据集概述:Hopkins RFO Bench
背景
- 目标:解决关键遗留异物(RFOs)在胸部X光检测中的挑战。
- 特点:首个且最大的关键RFOs胸部X光数据集,包含144例关键RFOs病例。
- 应用:用于开发临床影响显著的检测算法,并评估合成图像方法。
数据
- 来源:约翰霍普金斯医疗系统,18年间的144例关键RFOs病例。
- 组成:
- 144例关键RFOs病例
- 150例无RFOs病例
- 150例非关键RFOs病例
- 数据分割:训练集70%,验证集10%,测试集20%。
标注
- 图像级标注:按RFO阳性和阴性分类存放。
- 对象级标注:
- 格式:CSV或JSON文件。
- 标注类型:矩形(0)和多边形(1)。
- 坐标系统:笛卡尔像素坐标系,原点在左上角。
下载
- 数据集:https://huggingface.co/datasets/Yuliiiiiiiione/Hopkins_RFO_Bench/tree/main
- 数据内容:
- Hopkins RFO Bench:144例,JPG & JSON格式。
- 物理合成图像:4000例,JPG & CSV格式。
- 物理渲染模型:14例,OBJ格式。
- DDPM合成图像:4000例,JPG & CSV格式。
评估
- 分类任务:
- 指标:AUC(曲线下面积)。
- 输出格式:
prediction_classification.csv。
- 定位任务:
- 指标:FROC(自由响应接收器操作特性)。
- 输出格式:
prediction_localization.csv。
使用
- 工具:包含预处理和生成数据集的代码。
- 依赖:通过
pip install -e requirement.txt安装环境。 - 环境激活:
conda activate Hopkins_RFO。
基线模型
- 代码:提供在基线模型目录下。
合成方法
- DeepDRR-RFO:基于物理的合成方法,整合CT分割、3D模型构建和X光渲染。
- RoentGen-RFO:基于扩散的合成方法,定制RFO文本输入。
参考
- 网站模板参考自object-CXR。
搜集汇总
数据集介绍

构建方式
Hopkins RFOs Bench数据集通过约翰霍普金斯医疗系统18年间收集的144例关键遗留异物(RFOs)胸部X光图像构建而成。数据收集过程严格遵循IRB协议,采用数字化医学影像通信(DICOM)格式获取原始图像,并由专业放射科医师进行标准化标注,包括图像级和对象级标注(如多边形和边界框标注)。数据集按患者划分为训练集(70%)、验证集(10%)和测试集(20%),确保数据独立性。所有图像经过严格的去标识化处理,符合HIPAA隐私保护标准。
特点
该数据集作为首个公开的关键RFOs专项数据集,具有显著的临床稀缺性和技术挑战性。其核心特点包括:1)覆盖手术海绵、缝合针等高风险异物类型,弥补现有数据集中仅含非关键异物的缺陷;2)提供多层级标注体系,同时包含图像分类标签(有无RFOs)和精细的对象定位标注;3)通过平衡设计纳入150例无RFOs样本和150例非关键RFOs样本,有效解决类别不平衡问题。数据统计显示,关键RFOs图像平均含1.0个关键异物和2.7个总异物,真实反映临床复杂场景。
使用方法
该数据集支持两种核心任务范式:图像级分类任务要求模型根据X光图像判断RFOs存在与否,输出二元概率评分;对象级定位任务需检测并分类异物,输出边界框坐标及关键性分类。评估采用曲线下面积(AUC)和自由响应受试者操作特征(FROC)等指标。研究者可通过预训练-微调策略迁移现有检测模型(如Faster R-CNN、YOLOv5),或结合配套开发的物理模拟(DeepDRR-RFO)与扩散模型(RoentGen-RFO)合成数据增强方案。数据集开源地址为https://github.com/YuliWanghust/RFO_Bench,包含DICOM转JPG格式图像及标准化标注文件。
背景与挑战
背景概述
Hopkins RFOs Bench数据集由约翰霍普金斯大学的研究团队于2025年创建,旨在解决医学影像中关键遗留异物(RFOs)检测的难题。该数据集包含144张胸部X光图像,涵盖了18年来约翰霍普金斯医疗系统中的关键RFOs案例。这些图像经过严格标注,包括图像级和对象级标签,为开发高精度的人工智能检测模型提供了重要资源。该数据集的发布填补了医学影像领域关键RFOs数据稀缺的空白,显著提升了相关研究的临床实用性和技术可行性。
当前挑战
Hopkins RFOs Bench数据集面临的挑战主要包括两个方面:领域问题的挑战和构建过程的挑战。在领域问题方面,关键RFOs的罕见性和多样性使得检测算法难以达到高精度和鲁棒性。现有数据集往往仅包含非关键RFOs,缺乏对关键RFOs的有效覆盖。在构建过程中,数据收集面临临床案例稀缺、标注复杂以及患者隐私保护等难题。此外,合成数据生成方法(如物理模拟和扩散模型)在模拟关键RFOs的真实性和多样性方面仍存在显著局限性,影响了模型的泛化能力。
常用场景
经典使用场景
Hopkins RFOs Bench数据集在医学影像分析领域具有重要价值,尤其在胸部X光图像中关键遗留异物(RFOs)的检测方面。该数据集通过提供144例经过严格标注的关键RFOs案例,为研究人员提供了宝贵的实验数据。其经典使用场景包括训练和评估深度学习模型,如Faster RCNN、FCOS、RetinaNet和YOLO-v5等目标检测算法,以提升模型在复杂临床环境中的检测性能。
解决学术问题
该数据集解决了医学影像分析中关键RFOs检测数据稀缺的学术难题。由于关键RFOs(如手术针、海绵等)在临床中极为罕见,现有公开数据集多仅包含非关键异物,导致相关研究受限。Hopkins RFOs Bench通过系统收集18年间的真实病例,填补了这一空白,为开发高精度检测算法提供了数据基础。其意义在于推动了AI在医疗安全领域的应用,减少了因异物遗留导致的医疗事故风险。
衍生相关工作
围绕该数据集已衍生出多项创新研究,主要包括两类合成数据生成方法:基于物理模拟的DeepDRR-RFO和基于扩散模型的RoentGen-RFO。这些工作探索了合成数据在解决医学影像数据稀缺问题上的潜力。其中物理模拟方法展现出更好的性能提升效果,而扩散模型则展示了更高的视觉真实性。相关研究为医学图像合成领域提供了重要参考,推动了数据增强技术的发展。
以上内容由遇见数据集搜集并总结生成



