M3Bench

Name: M3Bench
Creator: 上海交通大学, 上海人工智能实验室
Published: 2025-02-28 01:29:46
License: 暂无描述

arXiv2025-02-28 更新2025-03-04 收录

下载链接：

http://arxiv.org/abs/2502.20301v1

下载链接

链接失效反馈

官方服务：

资源简介：

M3Bench是一个针对自动化医学成像机器学习任务的评估基准，包含了14个训练数据集，跨越五个解剖区域和三种成像模态，覆盖了二维和三维模型。这些数据集被用于四个通用任务：器官分割、异常检测、疾病诊断和报告生成，旨在解决医学成像领域中自动化机器学习的效率和准确性问题。

M3Bench is an evaluation benchmark for automated machine learning tasks in medical imaging. It includes 14 training datasets spanning five anatomical regions and three imaging modalities, covering both 2D and 3D models. These datasets are applied to four general-purpose tasks: organ segmentation, anomaly detection, disease diagnosis, and report generation, aiming to address the efficiency and accuracy issues of automated machine learning in the medical imaging field.

提供机构：

上海交通大学, 上海人工智能实验室

创建时间：

2025-02-28

搜集汇总

数据集介绍

构建方式

M3Builder数据集的构建方式是围绕医学影像自动机器学习流程展开的。它由四个专业的智能体组成，分别是任务管理员、数据工程师、模块架构师和模型训练师，它们协同工作，完成从数据预处理、环境配置到模型训练的整个医学影像机器学习流程。这些智能体在一个结构化的医学影像机器学习工作空间中运行，该工作空间为智能体提供数据集的文本描述、训练代码和交互工具，实现了无缝的通信和任务执行。

特点

M3Builder数据集的特点是其自动化和协作性。通过多智能体协同框架，M3Builder能够自动完成复杂的医学影像机器学习任务，包括器官分割、异常检测、疾病诊断和报告生成。此外，M3Builder还提供了一个包含14个训练数据集的基准测试M3Bench，涵盖了5个解剖区域、3种成像模式和2D/3D数据，为评估自动化医学影像机器学习的性能提供了标准化的基础。

使用方法

M3Builder数据集的使用方法是通过多智能体协同框架，将医学影像机器学习任务分解为四个子任务，并由四个专业的智能体分别负责。用户只需提供任务描述和原始训练数据，M3Builder就能自动完成整个开发过程，包括数据准备、模型构建、训练和部署。此外，M3Bench基准测试可以用于评估不同智能体在自动化医学影像机器学习中的性能。

背景与挑战

背景概述

在医疗影像分析领域，机器学习（ML）的应用潜力巨大，但同时也面临着诸多挑战。传统的机器学习流程需要大量的人工干预，从数据预处理、模型构建到训练和部署，每一步都需要专业人员的技术支持和资源投入。为了解决这一问题，上海交通大学和上海人工智能实验室的研究团队提出了M3Builder，一个基于多智能体系统的自动化机器学习框架。M3Builder的核心是一个由四个专门智能体组成的协作系统，这些智能体分别负责任务分析、数据处理、模块构建和模型训练，通过协作完成复杂的医疗影像ML工作流程。该系统运行在一个专门为医疗影像ML设计的结构化环境中，该环境为智能体提供数据集、代码模板和交互工具，实现无缝通信和任务执行。为了评估自动化医疗影像ML的进展，研究团队还提出了M3Bench，这是一个包含四个通用任务和14个训练数据集的基准，涵盖了五种解剖结构和三种成像模式，包括2D和3D数据。实验结果表明，M3Builder在完成医疗影像ML任务方面表现出色，使用Claude-3.7Sonnet作为智能体核心时，成功率高达94.29%，展现了在医疗影像领域实现完全自动化机器学习的巨大潜力。

当前挑战

M3Builder及其相关数据集M3Bench在医疗影像领域面临着一些挑战。首先，医疗影像工作流程的复杂性，包括各种疾病、成像模式和任务要求，使得工具的开发和集成变得困难。其次，尽管临床医生在其领域内是专家，但他们往往缺乏编码技能或资源来创建工具，这导致了临床需求与定制化AI解决方案之间的差距。此外，M3Builder的多智能体协作框架和医疗影像ML工作空间的设计也需要不断优化和改进，以提高系统的效率和可靠性。最后，为了更好地模拟临床专业知识，M3Builder的未来工作需要扩展到更广泛的医疗任务，并开发更强大的工具构建智能体系统。

常用场景

经典使用场景

M3Builder是一个多智能体系统，旨在自动化医疗影像中的机器学习（ML）工作流程。该系统包含四个专业化智能体，它们协作执行复杂的多步骤医疗ML工作流程，包括自动化数据处理、环境配置、自包含自动调试和模型训练。M3Builder的核心是医疗影像ML工作空间，这是一个结构化环境，为智能体提供数据集的自由文本描述、训练代码和交互工具，从而实现无缝通信和任务执行。M3Builder的一个经典使用场景是在医疗影像分析中自动构建AI工具，从而弥合现有工具集之间的差距，并促进动态智能体生态系统的创建，该系统能够在最小的人工干预下不断发展。

解决学术问题

M3Builder解决了医疗领域工具开发和应用不足的问题。医疗工作流程的复杂性以及临床医生缺乏编码技能和资源，使得工具开发和集成变得困难。M3Builder通过自动化ML工作流程，减少了开发AI工具的复杂性，并提高了临床医生获取定制化AI解决方案的能力。此外，M3Builder还提出了M3Bench，这是一个基准测试，用于评估自动化医疗影像ML的性能。M3Bench涵盖了广泛的任务和数据集，为评估智能体系统在自动化ML中的能力提供了标准化基础。

衍生相关工作

M3Builder衍生了多种相关工作，包括自动化数据准备、多模态模型训练和智能体协作等。例如，M3Builder可以与其他AI系统结合，实现更复杂的医疗影像分析任务。此外，M3Builder还可以用于开发新的智能体协作框架和算法，从而提高自动化ML的性能和效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集