KneeCoT

Hugging Face2026-04-02 更新2026-04-03 收录

下载链接：

https://huggingface.co/datasets/YiHui0124/KneeCoT

下载链接

链接失效反馈

官方服务：

资源简介：

KneeCoT 是一个大规模、临床基础的多模态膝关节 MRI 诊断视觉语言模型基准数据集，旨在填补真实世界骨科诊断工作流程中可扩展、专家标注数据集的空白。该数据集包含 25,000 个 3D 膝关节 MRI 扫描与专家标注的诊断报告、600,000 个临床验证的视觉问答（VQA）样本以及 50,000 个结构化思维链（CoT）推理标注。数据集明确模拟了放射科医生的逐步临床推理过程，为 AI 诊断系统提供细粒度、可追溯的解释性。KneeCoT 支持多种任务，包括医学报告生成、医学视觉问答、多模态思维链推理以及膝关节 MRI 异常检测。每个数据实例包含 MRI 检查方法、MR 发现、诊断印象、序列号以及详细的标签和问答数据，涵盖了膝关节的多个解剖结构和病理类型。

创建时间：

2026-03-27

原始信息汇总

KneeCoT 数据集概述

数据集简介

KneeCoT 是一个大规模、基于临床的多模态膝关节 MRI 诊断视觉-语言模型基准数据集。该数据集旨在解决与真实世界骨科诊断工作流程对齐的、可扩展的专家标注数据集的严重不足问题。

数据集构成

核心数据：包含 25,000 个 3D 膝关节 MRI 影像，每个影像均与专家标注的诊断报告配对。
视觉问答样本：包含 600,000 个经过临床验证的视觉问答样本。
思维链标注：包含 50,000 个结构化的思维链推理标注，用于显式建模放射科医师逐步的临床推理过程。

主要特点

提供细粒度、可追溯的 AI 诊断系统可解释性。
已通过对 12 个最先进的多模态大语言模型的全面基准测试进行了严格验证。
证明使用该数据集（尤其是结合思维链监督）训练的模型性能有显著提升。

支持的任务

医学报告生成：自动生成结构化的、临床准确的膝关节 MRI 放射学报告。
医学视觉问答：针对膝关节 MRI 的临床相关问题回答，涵盖以下 4 个子类型：
- 是/否二元问题
- 描述性开放问题
- 病变定位问题
- 诊断推理问题
多模态思维链推理：与骨科临床指南对齐的结构化、逐步诊断推理。
膝关节 MRI 异常检测：识别和分类膝关节病变（如半月板损伤、韧带损伤、软骨磨损、关节积液等）。

数据实例结构

一个标准数据实例包含以下核心组成部分，与真实临床诊断工作流程对齐：

检查方法
MRI 发现
印象
序列号
标签：一个包含多层级、结构化诊断信息的 JSON 对象，涵盖半月板、韧带、骨软骨单元、髌股关节、滑膜与关节腔、囊性病变、其他结构、病理机制、任务标签和主要病变类型。
问答数据：包含一系列问题-答案对，每个对包含问题、答案和类型（如 yes_no, descriptive, localization）。

补充材料

可通过以下链接下载补充材料（PDF）： https://huggingface.co/datasets/YOUR_REPO_NAME/resolve/main/KneeCoT_Supplementary_Material.pdf

搜集汇总

数据集介绍

构建方式

在医学影像人工智能领域，构建高质量的多模态数据集是推动诊断模型发展的关键。KneeCoT数据集通过整合25,000个三维膝关节磁共振成像（MRI）容积数据与专家标注的诊断报告，构建了一个大规模、临床基础扎实的基准。其构建过程严格遵循真实世界骨科诊断工作流，不仅生成了60万个经过临床验证的视觉问答样本，还精心标注了5万个结构化的思维链推理注释，从而系统性地建模了放射科医师逐步临床推理的过程。

特点

该数据集的核心特点在于其深度整合了多模态信息与结构化推理。它不仅提供了海量的影像-报告对，更通过详尽的视觉问答样本覆盖了二元判断、描述性回答、病灶定位及诊断推理等多种问题类型。尤为突出的是，数据集嵌入了精细的思维链注释，为人工智能系统提供了可追溯、可解释的推理路径，显著增强了模型在复杂临床场景下的决策透明度与可靠性。

使用方法

在应用层面，KneeCoT数据集支持多种前沿的医疗人工智能任务。研究者可利用其进行膝关节MRI放射报告的自动生成，或开发针对特定病理的视觉问答系统。数据集内嵌的思维链注释为训练具备逐步推理能力的多模态大语言模型提供了监督信号，有助于提升模型在异常检测、病灶分类等任务上的性能。其标准化的JSON数据格式确保了数据易于加载与处理，便于集成到现有的机器学习管道中进行模型训练与评估。

背景与挑战

背景概述

在医学人工智能领域，膝关节磁共振成像（MRI）的自动诊断长期面临多模态数据融合与临床推理可解释性的瓶颈。KneeCoT数据集应运而生，旨在弥合大规模、专家标注数据集与真实世界骨科诊断工作流之间的关键鸿沟。该数据集由研究团队于近期构建，其核心研究问题聚焦于如何通过链式思维（Chain-of-Thought）建模，显式模拟放射科医师逐步临床推理过程，从而为视觉-语言模型提供细粒度、可追溯的决策支持。通过整合25,000个三维膝关节MRI容积与专家标注报告、60万个临床验证的视觉问答样本以及5万条结构化推理标注，该数据集显著提升了多模态大语言模型在膝关节病理检测、报告生成等任务上的性能，推动了辅助诊断系统向更高解释性与可靠性演进。

当前挑战

KneeCoT数据集致力于解决膝关节MRI多模态诊断中的核心挑战，即如何实现模型决策过程与临床医生思维链的对齐，以提升诊断的可信度与可解释性。具体而言，其构建过程面临多重困难：首先，医学影像与文本报告的对齐需克服专业术语的歧义性与标注一致性难题，要求放射专家进行精细且耗时的逐层审核；其次，链式思维注释的生成必须严格遵循骨科临床指南，确保每一步推理的医学准确性，这涉及复杂的知识建模与质量控制流程。此外，数据规模的扩展受到隐私合规与多中心数据标准化壁垒的制约，需在伦理框架内实现高质量数据的规模化采集与匿名化处理。

常用场景

经典使用场景

在医学影像人工智能领域，KneeCoT数据集为膝关节磁共振成像（MRI）的视觉语言模型提供了经典的应用场景。该数据集通过整合大规模的三维MRI影像与专家标注的诊断报告，构建了一个多模态的临床推理基准。其核心在于模拟放射科医师的逐步诊断思维过程，支持从影像分析到结构化报告生成的完整工作流。经典使用场景包括基于链式思维（CoT）的自动报告生成，以及涵盖多种问题类型的医学视觉问答，这些任务直接对应了临床实践中对膝关节病变的精细化评估需求。

衍生相关工作

围绕KneeCoT数据集，已衍生出一系列相关的经典研究工作。这些工作主要集中于开发与评估先进的多模态大语言模型（MLLMs）在膝关节MRI诊断任务上的性能。数据集本身已用于对12种前沿模型进行综合基准测试，验证了链式思维标注对模型推理能力的增强效果。后续研究可能基于此构建更专业的诊断模型，探索小样本学习、领域自适应等方法，以进一步提升模型在复杂临床病例上的泛化能力与鲁棒性。

数据集最近研究