ACR Appropriateness Criteria
收藏arXiv2025-10-07 更新2025-10-08 收录
下载链接:
https://huggingface.co/datasets/fmenol/acr-appro-3opts-v2
下载链接
链接失效反馈官方服务:
资源简介:
ACR Appropriateness Criteria 数据集是一套全面的指南,涵盖了257个临床主题,超过1200个临床变体和超过3700个临床场景。每个指南通常定义一个临床状况,并提供多个变体,以及针对不同患者人口统计学或并发症的轻微场景资格或子组。对于每个变体,指南列出一组成像程序,并对其进行适当性评估。数据集旨在帮助临床医生选择最合适的诊断程序,并提高患者护理的质量。
The ACR Appropriateness Criteria dataset is a comprehensive collection of guidelines encompassing 257 clinical topics, over 1200 clinical variants, and more than 3700 clinical scenarios. Each guideline typically defines a clinical condition, provides multiple variants, and includes qualifying scenarios or subgroups tailored to different patient demographics or comorbidities. For each variant, the guideline lists a set of imaging procedures and assigns an appropriateness rating to them. The dataset aims to assist clinicians in selecting the most appropriate diagnostic procedures and improving the quality of patient care.
提供机构:
爱丁堡大学信息学院
创建时间:
2025-10-07
原始信息汇总
数据集概述
基本信息
- 数据集名称: acr-appro-3opts-v2
- 存储位置: https://huggingface.co/datasets/fmenol/acr-appro-3opts-v2
- 总大小: 6,413,851字节
- 下载大小: 1,310,433字节
数据组成
数据分割
- 训练集: 9,764个样本,5,137,980字节
- 测试集: 1,221个样本,635,971字节
- 开发集: 1,221个样本,639,900字节
特征结构
核心特征
- Condition(条件)
- Variant(变体)
- Procedure(程序)
- Appropriateness Category(适宜性类别)
- SOE(证据强度)
- References(参考文献)
评级特征
- Adult RRL (scale) - 成人相对辐射水平(等级)
- Adult RRL (dosage) - 成人相对辐射水平(剂量)
- Peds RRL (scale) - 儿科相对辐射水平(等级)
- Peds RRL (dosage) - 儿科相对辐射水平(剂量)
- Rating(评级)
- Median(中位数)
评估特征
- Assessment - 1至Assessment - 9(评估1-9)
搜集汇总
数据集介绍

构建方式
在医学影像决策支持领域,ACR Appropriateness Criteria数据集的构建依托于美国放射学会(ACR)发布的权威临床指南。该数据集通过系统化解析257个临床主题的指南文档,涵盖超过1,200种临床变体和3,700余种具体场景,形成层次化结构。每个变体关联一组影像学检查程序(如X射线、CT、MRI),并标注适宜性等级(通常适宜、可能适宜、通常不适宜)。为增强数据多样性,研究团队利用MedGemma-27B模型为每个变体生成八种合成临床描述,包括语义渐变和同义词丰富的表述,最终形成8,840对场景-变体训练样本,有效模拟真实临床文档的词汇变异性和表达复杂性。
特点
该数据集的核心特征体现在其高度结构化的临床知识组织体系。指南内容通过多级分类体系将临床条件、变体与影像程序精准映射,支持对复杂医疗场景的细粒度解析。数据覆盖范围广泛,涉及放射学多个子领域,且每年由跨学科专家团队更新维护,确保内容的时效性与权威性。特别值得注意的是,数据集通过合成生成技术强化了语言多样性,有效捕捉临床实践中常见的术语变异、缩写和表述差异,为模型训练提供了对抗语言歧义性的关键能力。这种设计使数据集成为连接自由文本临床叙述与标准化指南的重要桥梁。
使用方法
该数据集的应用主要通过多阶段检索增强生成(RAG)框架实现。首先,经领域自适应微调的ColBERT检索模型将临床场景的自由文本描述映射至指南中的对应变体,通过上下文化交互机制实现语义级匹配。随后,大型语言模型作为选择代理对检索结果进行筛选,确定最匹配的临床变体。最终,系统输出该变体下标注为“通常适宜”的影像学检查程序集合。该方法显著提升了指南检索的准确度(召回率达93.9%),并通过多智能体协作确保推荐结果与循证指南的高度一致性,为临床决策提供可靠支持。
背景与挑战
背景概述
美国放射学会适宜性标准(ACR Appropriateness Criteria)自1993年由美国放射学会主导创建,旨在为临床医生提供基于循证医学的医学影像检查指导。该标准涵盖257个诊断主题、逾1200种临床变异及3700余种具体场景,由跨学科专家团队持续修订,通过结构化评级体系规范影像检查的临床适用性。作为放射学实践的重要参考,其系统化的证据整合与年度更新机制显著提升了医疗决策的科学性与一致性。
当前挑战
该数据集核心挑战在于弥合非结构化临床叙述与标准化指南间的语义鸿沟,具体表现为:临床术语的多样性与模糊性导致传统检索模型匹配困难,例如患者主诉‘眼球震颤’与指南术语‘前庭功能障碍’的表述差异;构建过程中需克服医学语言特殊性带来的标注成本高昂问题,且需确保合成数据能真实反映临床叙述的词汇变异与语境复杂性。
常用场景
经典使用场景
在医学影像决策支持领域,ACR Appropriateness Criteria数据集常被用于构建智能辅助系统,该系统通过解析非结构化的临床叙述,自动匹配至ACR指南中的结构化影像推荐方案。例如,当输入“28岁女性出现局部非周期性乳房疼痛”时,系统能够精准检索并输出“乳腺超声检查”作为首选影像学方法,有效模拟临床医生的决策流程。
实际应用
在实际医疗场景中,该数据集支撑的决策系统可嵌入电子健康记录平台,为放射科医师与初级保健医生提供实时影像选择建议。例如,在急诊科快速评估创伤患者时,系统能依据临床症状自动推荐“通常适用”的CT或MRI检查,显著降低不必要辐射暴露与医疗成本,提升诊疗流程的标准化程度。
衍生相关工作
基于该数据集衍生的经典研究包括多智能体RAG架构的探索,如结合ColBERT检索与LLM推理的临床决策管道。相关成果进一步推动了accGPT与Glass AI等系统的开发,这些工作通过强化检索增强生成技术,在ICD编码自动化、影像指南适配等任务中实现了超越基线模型的准确率与临床适用性。
以上内容由遇见数据集搜集并总结生成



