five

US-43d

收藏
arXiv2024-11-25 更新2024-11-27 收录
下载链接:
https://github.com/CAMMA-public/UltraSam
下载链接
链接失效反馈
资源简介:
US-43d是由斯特拉斯堡大学和斯特拉斯堡图像引导手术研究所创建的大型公开超声分割数据集,包含43个公开数据集,共计280,000多张图像和分割掩码,覆盖50多个解剖结构。数据集内容丰富,包括2D和3D扫描图像,涉及心脏、胎儿头部、甲状腺和乳腺病变等多种临床应用。数据集的创建过程涉及从多个平台爬取数据,并进行预处理以去除标签背景重叠。US-43d旨在解决超声图像分析中的自动分割问题,提供了一个强大的基础模型,适用于多种下游任务,如分类和分割。

US-43d is a large-scale open-access ultrasound segmentation dataset developed by the University of Strasbourg and the Strasbourg Institute of Image-Guided Surgery. It includes 43 public datasets, totaling over 280,000 images and segmentation masks, covering more than 50 anatomical structures. The dataset features rich content comprising 2D and 3D scan images, and supports diverse clinical applications such as those related to heart, fetal head, thyroid, and breast lesions. The development of this dataset involved data crawling from multiple platforms, followed by preprocessing steps to eliminate label-background overlaps. US-43d aims to tackle the automatic segmentation problem in ultrasound image analysis, serving as a robust foundational benchmark applicable to various downstream tasks including classification and segmentation.
提供机构:
斯特拉斯堡大学;斯特拉斯堡图像引导手术研究所
创建时间:
2024-11-25
搜集汇总
数据集介绍
main_image_url
构建方式
US-43d数据集的构建基于大规模的公开超声图像分割数据,通过整合43个开放访问的超声数据集,涵盖超过280,000张图像和50多个解剖结构的分割掩码。这些数据集来自多个临床应用,包括心脏、胎儿头部、甲状腺和乳腺病变等,确保了数据的多源性和广泛性。数据集的构建过程中,研究人员从多个平台如Papers with Code、Google Dataset Search等搜集数据,并进行了预处理以去除标签背景重叠,确保数据质量。
使用方法
US-43d数据集主要用于训练和验证超声图像分析模型,特别是基于深度学习的分割和分类任务。研究人员可以使用该数据集来训练和微调模型,以提高其在不同临床应用中的表现。数据集的多样性和高质量使其适用于多种下游任务,如实例分割、图像分类和交互式分割。此外,数据集还提供了转换为COCO格式的脚本,便于与其他计算机视觉任务的数据集进行兼容和比较。
背景与挑战
背景概述
超声成像(Ultrasound, US)因其实时性、安全性和成本效益,在现代医学中不可或缺。它在动态评估如胎儿监测中发挥关键作用,其便携性使其在资源匮乏的环境中也能广泛应用,显著提升了诊断护理的覆盖面。然而,超声图像分析面临噪声、变异性和专业解读需求等挑战。尽管深度学习解决方案如解剖标志识别、组织特征描述和介入手术中的针迹追踪等已提出,但这些方法依赖于大量标注数据,而这些数据因专家标注需求而稀缺且缺乏多样性。US-43d数据集由斯特拉斯堡大学、CNRS、INSERM、ICube和IHU-Strasbourg等机构的研究人员创建,旨在通过整合43个公开的超声分割数据集,包含超过280,000张图像和分割掩码,覆盖50多个解剖结构,以应对自动化超声图像分析的挑战。
当前挑战
US-43d数据集的构建面临多重挑战。首先,超声图像与自然图像之间的显著领域差异使得传统微调方法难以适用。其次,超声图像在不同检查区域(如胸部、卵巢、内窥镜)的变异性极大,导致训练通用超声模型的困难。此外,数据标注的稀缺性和专家依赖性进一步加剧了问题。尽管SAM模型在一般计算机视觉中展示了强大的零样本分割能力,但其应用于超声图像仍面临数据复杂性和领域特异性的挑战。现有尝试如MedSAM、SAM-Med和Medical SAM Adapter虽已尝试适应,但仍未完全解决超声图像分析的问题。因此,构建一个能够直接应用于多样超声数据的通用SAM风格模型仍是当前研究社区的重大挑战。
常用场景
经典使用场景
US-43d数据集在超声图像分析领域中被广泛应用于训练和验证基于深度学习的分割模型。其经典使用场景包括但不限于:通过整合来自43个公开数据集的280,000多张图像及其对应的分割掩码,US-43d为模型提供了丰富的训练数据,涵盖了超过50种解剖结构。这种大规模的数据集使得研究人员能够训练出具有强大泛化能力的超声图像分割模型,如UltraSam,该模型能够处理多种临床应用中的超声图像,包括心脏、胎儿头部、甲状腺和乳腺病变等。
解决学术问题
US-43d数据集解决了超声图像分析中长期存在的数据稀缺和多样性不足的问题。通过提供一个包含280,000多张图像和分割掩码的大规模数据集,US-43d显著提升了模型的训练效果和泛化能力。这不仅有助于推动超声图像分割技术的发展,还为其他医学图像分析任务提供了宝贵的数据资源。此外,US-43d的发布促进了跨学科研究,推动了超声图像分析在临床诊断中的应用,具有重要的学术意义和实际价值。
实际应用
US-43d数据集在实际应用中展现了其巨大的潜力。在临床环境中,该数据集支持开发自动化的超声图像分析工具,如UltraSam模型,这些工具能够辅助医生进行快速且准确的病变检测和分割。例如,在乳腺病变分析中,UltraSam能够高效地识别和分割乳腺肿瘤,从而提高诊断的准确性和效率。此外,US-43d还支持开发用于胎儿监测、甲状腺病变检测等应用的自动化系统,显著提升了医疗服务的质量和效率。
数据集最近研究
最新研究方向
在超声图像分析领域,US-43d数据集的最新研究方向主要集中在通过大规模开放访问分割数据集来训练基础模型,以解决超声图像的复杂性和标注数据稀缺的问题。研究团队通过整合43个开放访问的超声数据集,构建了包含超过280,000张图像和分割掩码的US-43d数据集,并在此基础上训练了名为UltraSam的模型。UltraSam是Segment Anything Model(SAM)的专门化版本,支持点提示和框提示,并展示了在零样本分割任务中的显著改进。此外,UltraSam还被用作下游任务的模型初始化,如分类和分割,显示出其在多种临床应用中的广泛适用性和高效性。这一研究不仅推动了超声图像分析的自动化进程,还为未来在低资源环境下提供高质量诊断服务奠定了基础。
相关研究论文
  • 1
    UltraSam: A Foundation Model for Ultrasound using Large Open-Access Segmentation Datasets斯特拉斯堡大学;斯特拉斯堡图像引导手术研究所 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作