TemMed-Bench

Name: TemMed-Bench
Creator: UCLA NLP
Published: 2025-09-18 15:00:44
License: 暂无描述

Hugging Face2025-09-18 更新2025-09-19 收录

下载链接：

https://huggingface.co/datasets/uclanlp/TemMed-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

TemMed-Bench是一个医学图像时间推理的数据集，包含历史病情信息和多张来自不同访问的图像。它包括三种任务：视觉问答、报告生成和图像对选择，并提供了一个包含超过17000个实例的知识库。

提供机构：

UCLA NLP

创建时间：

2025-09-18

原始信息汇总

TemMed-Bench 数据集概述

数据集基本信息

语言: 英文
许可证: CC-BY-4.0
数据规模: 1K<n<10K
任务类别: 视觉问答、多项选择、文本生成
官方名称: TemMed-Bench

配置与数据文件

Image Pair Selection
- 测试集文件: TestSet_ImagePairSelection.json
VQA & Report Generation
- 测试集文件: TestSet_VQA_ReportGeneration.json
VQA_Selected_2000
- 测试集文件: TestSet_SelectedVQA_2000.json
TrainSet KnowledgeCorpus
- 训练集文件: TrainSet_KnowledgeCorpus.json

核心特点

时序推理重点: 每个样本包含历史病情信息，挑战模型分析患者随时间变化的能力
多图像输入: 每个样本包含来自不同就诊次数的多张图像作为输入
多样化任务套件: 包含三个任务（VQA、报告生成、图像对选择），基于1,000个样本的测试集构建

附加信息

知识语料库包含超过17,000个实例
源数据文件需从斯坦福AIMI数据集页面下载（https://stanfordaimi.azurewebsites.net/datasets/5158c524-d3ab-4e02-96e9-6ee9efc110a1）

联系方式

Junyi Zhang: JunyiZhang2002@g.ucla.edu

搜集汇总

数据集介绍

构建方式

在医学影像时序分析领域，TemMed-Bench数据集基于CheXpert Plus数据集的授权索引构建，通过整合多时间节点的医疗影像与临床记录形成样本。该数据集从斯坦福AIMI平台获取原始影像数据，并构建了包含历史病情信息的结构化测试集，其中1000个样本支撑三大任务模块，知识库另含17000个训练实例，严格遵循临床数据脱敏与标准化处理流程。

使用方法

使用者需首先从斯坦福AIMI官方平台下载原始CheXpert Plus影像数据，再加载本数据集提供的索引文件进行对齐。数据集提供四个配置模块：图像对选择、视觉问答与报告生成、精选问答子集及知识库训练集，可通过HuggingFace接口按需加载特定任务数据。测试时需注意模型应支持多图像输入与时序上下文理解，以充分发挥数据集的诊断推理价值。

背景与挑战

背景概述

医学影像时序分析作为智慧医疗的核心研究方向，旨在通过多时间点的影像数据追踪疾病演进轨迹。TemMed-Bench由加州大学洛杉矶分校研究团队于2023年推出，专注于解决跨时间维度的医学影像推理问题。该数据集基于斯坦福大学CheXpert Plus胸部X光数据库构建，包含千级测试样本和万级知识语料，通过整合历史病情信息与多影像输入，推动视觉-语言模型在临床决策支持系统中的应用，为动态病程评估提供了标准化评估框架。

当前挑战

该数据集直面医学影像时序推理的双重挑战：在领域层面，需解决跨时间点病灶变化检测、病情演进模式识别等动态分析难题，这对模型的时空关联建模能力提出极高要求；在构建层面，面临多中心影像数据标准化对齐、时序标注一致性校验等技术瓶颈，同时需严格遵守医疗数据隐私保护规范，通过数据索引与源文件分离的分布式架构实现合规访问。

常用场景

经典使用场景

在医学影像时序分析领域，TemMed-Bench数据集通过提供包含多次就诊记录的影像序列与对应诊断信息，为视觉语言模型构建了多维度的评估框架。其经典应用场景集中于模型对患者病情演变的纵向推理能力测试，要求系统不仅识别单次影像特征，更能通过对比历史与当前影像的细微变化，生成符合临床逻辑的时序诊断结论。

解决学术问题

该数据集有效解决了医学人工智能领域中时序推理的系统性评估难题，为多图像输入条件下的视觉语言模型提供了标准化测试基准。通过融合视觉问答、报告生成和图像对选择三重任务，它推动了模型在动态医学场景中的因果推断与跨模态融合能力研究，填补了传统静态影像分析在时间维度上的评估空白。

实际应用

临床实践中，TemMed-Bench支撑的模型可应用于放射科随访诊断辅助系统，通过自动比对患者历次CT或X光影像，生成结构化病情演进报告。这类系统能有效减轻医师工作负荷，提升慢性疾病监测效率，尤其在肿瘤进展评估、术后恢复追踪等需要长期影像对比的场景中展现显著价值。

数据集最近研究