five

AMOS-MM|医学图像分析数据集|自动化诊断数据集

收藏
arXiv2025-03-18 更新2025-03-19 收录
医学图像分析
自动化诊断
下载链接:
https://github.com/rsummers11/LEAVS
下载链接
链接失效反馈
资源简介:
AMOS-MM数据集是由美国国立卫生研究院临床中心提供的公开数据集,包含腹部CT体积和相应的报告。该数据集被用于训练LEAVS标注系统,该系统能够从腹部CT报告中提取结构化的标签,这些标签综合了大部分CT报告中的发现类型,并用于训练一个单一的视觉模型,该模型能够对多个器官进行正常或异常的分类。
提供机构:
美国国立卫生研究院临床中心
创建时间:
2025-03-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
AMOS-MM数据集的构建基于腹部CT扫描报告,通过LEAVS(基于大语言模型的腹部视觉监督标注器)系统进行标注。该系统采用了一种创新的提示策略,结合句子过滤和多选题的树状决策系统,能够从复杂的腹部CT报告中提取出七种异常类型的确定性存在和紧急程度。LEAVS系统通过链式思维提示(CoT)策略,逐步解析报告中的医学含义,确保标注的准确性和全面性。数据集涵盖了九个腹部器官的异常情况,确保了广泛的病理覆盖范围。
使用方法
AMOS-MM数据集的使用方法主要围绕其结构化标签展开。研究人员可以利用这些标签训练视觉模型,实现对腹部CT影像中多个器官的异常分类。数据集中的标注信息包括异常类型、存在确定性以及紧急程度,这些信息可以用于监督学习模型的训练。通过结合预训练的CT嵌入器和器官分割工具,研究人员可以构建一个专注于特定器官的分类模型。此外,数据集还提供了代码和详细的标注流程,便于研究人员复现和扩展其应用场景。
背景与挑战
背景概述
AMOS-MM数据集是由美国国立卫生研究院临床中心(NIH Clinical Center)和西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)等机构的研究人员于2022年创建的,旨在为腹部多器官CT图像分割提供大规模基准数据。该数据集包含超过1,000个CT扫描样本,涵盖了肝脏、胆囊、脾脏、肾脏等多个腹部器官,并提供了详细的标注信息。AMOS-MM的发布为医学影像分析领域的研究提供了重要的数据支持,特别是在腹部多器官分割和异常检测方面,推动了基于深度学习的医学影像分析技术的发展。该数据集不仅在学术界引起了广泛关注,还在临床应用中展示了其潜在价值,尤其是在自动化诊断系统的开发中。
当前挑战
AMOS-MM数据集在构建和应用过程中面临多重挑战。首先,腹部CT图像的复杂解剖结构和多样化的病理表现使得数据标注的准确性和一致性难以保证,尤其是在多器官分割任务中,不同器官之间的边界模糊性增加了标注难度。其次,数据集的构建依赖于大量医学影像报告的手动标注,这一过程耗时且容易受到主观判断的影响。尽管LEAVS等基于大语言模型的标注工具在一定程度上提高了标注效率,但其在处理长文本报告时的推理时间较长,限制了其在实时应用中的可行性。此外,数据集中不同器官的异常类型分布不均,导致模型训练时可能出现类别不平衡问题,影响模型的泛化能力。这些挑战不仅影响了数据集的构建质量,也对基于该数据集的研究提出了更高的技术要求。
常用场景
经典使用场景
AMOS-MM数据集在医学影像分析领域中被广泛用于腹部CT影像的自动标注和异常检测。该数据集通过结合大语言模型(LLM)技术,能够从复杂的腹部CT报告中提取结构化的异常标签,涵盖多个腹部器官的多种病理类型。这一数据集的使用场景主要集中在医学影像的自动化处理、辅助诊断以及多器官异常分类模型的训练与验证。
解决学术问题
AMOS-MM数据集解决了腹部CT影像分析中标注复杂性和多样性的问题。传统的标注方法依赖于规则或深度学习算法,难以应对腹部CT报告中复杂的解剖结构和多样化的病理类型。通过引入LLM技术,该数据集能够高效提取多种异常类型及其紧急程度,显著提升了标注的准确性和覆盖范围,为腹部CT影像的自动化分析提供了可靠的数据支持。
实际应用
在实际应用中,AMOS-MM数据集被用于开发辅助诊断系统,帮助放射科医生快速识别腹部CT影像中的异常。其标注的异常类型和紧急程度信息可用于优化医疗资源的分配,提升诊断效率。此外,该数据集还被用于训练通用异常检测模型,为腹部CT影像的自动化分析提供了技术基础,推动了医学影像AI在临床实践中的应用。
数据集最近研究
最新研究方向
近年来,AMOS-MM数据集在腹部CT影像分析领域的研究方向主要集中在基于大语言模型(LLMs)的自动化标注系统开发上。LEAVS(Large language model Extractor for Abdominal Vision Supervision)作为一种新型标注工具,通过结合链式思维提示策略和多选题决策树系统,能够从复杂的腹部CT报告中提取出多种异常类型的结构化标签。这一方法不仅显著提高了标注的准确性和效率,还在异常检测和紧急程度评估方面表现出色,平均F1得分达到0.89,超越了传统规则算法和人工标注的表现。LEAVS的成功应用为腹部CT影像的通用异常检测模型提供了有力支持,推动了医学影像分析领域的前沿发展。
相关研究论文
  • 1
    LEAVS: An LLM-based Labeler for Abdominal CT Supervision美国国立卫生研究院临床中心 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

(주)동구바이오제약 2024년 기업정보 | 직원수, 근무환경, 복리후생 등

(주)동구바이오제약 기업소개 - 업력 : 42년차, 기업형태 : -, 업종 : 완제 의약품 제조업 | (주)동구바이오제약의 직원수, 연봉, 채용, 근무환경, 복리후생, 재무정보 등이 궁금하시다면, 사람인에서 더 많은 정보를 확인해보세요.

www.saramin.co.kr 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

广东省标准地图

该数据类主要为广东省标准地图信息。标准地图依据中国和世界各国国界线画法标准编制而成。该数据包括广东省全图、区域地图、地级市地图、县(市、区)地图、专题地图、红色印迹地图等分类。

开放广东 收录

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录