five

AbdomenAtlas

收藏
arXiv2024-07-24 更新2024-07-25 收录
下载链接:
https://www.zongweiz.com/dataset
下载链接
链接失效反馈
官方服务:
资源简介:
AbdomenAtlas是由约翰斯·霍普金斯大学领衔创建的大型腹部CT数据集,包含20,460个三维CT体积,来自112家医院,覆盖多样的地理和人口。该数据集提供了673,000个高质量的解剖结构掩码,由10名放射科医生借助AI算法标注。数据集的创建过程包括专家手动标注和半自动标注,旨在支持大规模AI模型的开发和算法基准测试。AbdomenAtlas的应用领域广泛,特别是在医疗图像分析中,旨在提高AI算法在复杂临床场景中的性能和可靠性。

AbdomenAtlas is a large-scale abdominal CT dataset led by Johns Hopkins University. It contains 20,460 3D CT volumes collected from 112 hospitals, covering diverse geographic and demographic backgrounds. The dataset provides 673,000 high-quality anatomical structure masks, which were annotated by 10 radiologists with the aid of AI algorithms. Its development process integrates expert manual annotation and semi-automatic annotation, and is designed to support the development of large-scale AI models and algorithm benchmarking. AbdomenAtlas has a wide range of application scenarios, particularly in medical image analysis, with the objective of enhancing the performance and reliability of AI algorithms in complex clinical settings.
提供机构:
约翰斯·霍普金斯大学
创建时间:
2024-07-24
搜集汇总
数据集介绍
main_image_url
构建方式
AbdomenAtlas 数据集的构建采用了大规模、多中心的数据收集方式,涵盖了来自112家医院的20,460个三维CT体积。首先,由10名放射科专家手动标注了5,246个CT体积中的22个解剖结构,随后通过半自动化的标注流程对剩余的15,214个CT体积进行标注。该流程结合了AI算法的预测与放射科专家的修正,AI算法通过学习修正后的标注不断改进其预测精度,从而显著提高了标注效率。
特点
AbdomenAtlas 数据集的显著特点包括其大规模、多中心的数据来源,涵盖了广泛的地理和人口多样性。数据集提供了673,000个高质量的解剖结构标注,涵盖25个腹部解剖结构,且标注质量经过严格的质量控制。此外,数据集的多样性确保了AI算法在不同临床环境中的泛化能力,使其成为开发和验证AI算法的重要资源。
使用方法
AbdomenAtlas 数据集可用于多种医学图像分析任务,特别是腹部解剖结构的分割和AI算法的基准测试。研究者可以通过该数据集进行监督学习和迁移学习,训练和验证AI模型。数据集还支持国际竞赛BodyMaps,旨在评估AI算法在实际临床环境中的可靠性和效率。研究者可以通过访问数据集的官方网站获取代码、模型和数据,进行进一步的研究和开发。
背景与挑战
背景概述
AbdomenAtlas 是由约翰霍普金斯大学等多个机构联合开发的大型腹部 CT 数据集,于 2024 年发布。该数据集包含了来自 112 家医院的 20,460 个三维 CT 体积,涵盖了多种人群、地理和医疗设施的多样性。数据集提供了 673,000 个高质量的解剖结构掩码,由 10 名放射科医生在 AI 算法的辅助下进行标注。AbdomenAtlas 的创建旨在为大规模预训练模型提供重要资源,减少专家放射科医生的标注工作量,并推动 AI 算法在临床应用中的广泛迁移。此外,该数据集还为评估 AI 算法的性能提供了大规模基准,特别是在复杂临床场景中的可靠性和泛化能力。
当前挑战
AbdomenAtlas 数据集的构建面临多重挑战。首先,医学图像的多样性,包括不同医院、成像协议和患者群体的差异,使得模型的泛化能力成为一个重要问题。其次,数据集的构建过程中,手动标注 5,246 个 CT 体积耗时且成本高昂,而半自动标注过程虽然提高了效率,但仍需放射科医生的校正,以确保标注质量。此外,数据集中未包含肿瘤标注,这限制了其在肿瘤检测和分割任务中的应用。最后,尽管 AbdomenAtlas 提供了大规模的标注数据,但如何有效利用这些数据进行模型训练,并在不同临床环境中实现算法的可靠性和高效性,仍然是一个亟待解决的挑战。
常用场景
经典使用场景
AbdomenAtlas 数据集的经典使用场景主要集中在医学图像分析领域,尤其是在腹部器官的分割任务中。该数据集提供了大规模、多中心、高质量的腹部 CT 图像及其详细的解剖结构标注,使得研究人员能够训练和验证用于腹部器官分割的深度学习模型。通过利用 AbdomenAtlas 数据集,研究者可以开发出具有高精度和泛化能力的分割算法,从而在临床环境中实现更准确的器官定位和病变检测。
解决学术问题
AbdomenAtlas 数据集解决了医学图像分析领域中常见的数据稀缺和标注不一致问题。由于医学图像的获取和标注成本高昂,现有的公开数据集通常规模较小且标注质量参差不齐,导致模型在不同中心和患者群体中的泛化能力有限。AbdomenAtlas 通过提供来自 112 家医院的多中心数据,涵盖了广泛的解剖结构和患者群体,显著提升了模型的泛化能力和鲁棒性。此外,该数据集还通过半自动标注流程,大幅减少了专家放射科医生的工作量,推动了大规模数据集的构建和应用。
衍生相关工作
AbdomenAtlas 数据集的发布催生了一系列相关的经典工作,尤其是在医学影像分割和深度学习模型的预训练领域。基于该数据集,研究者开发了名为 SuPreM 的预训练模型套件,这些模型通过大规模监督学习在 AbdomenAtlas 上进行预训练,并在多个下游任务中展示了卓越的迁移学习能力。此外,AbdomenAtlas 还启发了 ISBI & MICCAI 2024 的 BodyMaps 挑战赛,该挑战赛利用 AbdomenAtlas 数据集进行算法基准测试,推动了医学影像分割算法的创新和优化。这些衍生工作不仅提升了医学影像分析的技术水平,还为未来的多中心数据集构建和应用提供了宝贵的经验。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作