TemMed-Bench
收藏Hugging Face2025-09-18 更新2025-09-19 收录
下载链接:
https://huggingface.co/datasets/uclanlp/TemMed-Bench
下载链接
链接失效反馈官方服务:
资源简介:
TemMed-Bench是一个医学图像时间推理的数据集,包含历史病情信息和多张来自不同访问的图像。它包括三种任务:视觉问答、报告生成和图像对选择,并提供了一个包含超过17000个实例的知识库。
提供机构:
UCLA NLP
创建时间:
2025-09-18
原始信息汇总
TemMed-Bench 数据集概述
数据集基本信息
- 语言: 英文
- 许可证: CC-BY-4.0
- 数据规模: 1K<n<10K
- 任务类别: 视觉问答、多项选择、文本生成
- 官方名称: TemMed-Bench
配置与数据文件
- Image Pair Selection
- 测试集文件: TestSet_ImagePairSelection.json
- VQA & Report Generation
- 测试集文件: TestSet_VQA_ReportGeneration.json
- VQA_Selected_2000
- 测试集文件: TestSet_SelectedVQA_2000.json
- TrainSet KnowledgeCorpus
- 训练集文件: TrainSet_KnowledgeCorpus.json
核心特点
- 时序推理重点: 每个样本包含历史病情信息,挑战模型分析患者随时间变化的能力
- 多图像输入: 每个样本包含来自不同就诊次数的多张图像作为输入
- 多样化任务套件: 包含三个任务(VQA、报告生成、图像对选择),基于1,000个样本的测试集构建
附加信息
- 知识语料库包含超过17,000个实例
- 源数据文件需从斯坦福AIMI数据集页面下载(https://stanfordaimi.azurewebsites.net/datasets/5158c524-d3ab-4e02-96e9-6ee9efc110a1)
联系方式
- Junyi Zhang: JunyiZhang2002@g.ucla.edu
搜集汇总
数据集介绍

构建方式
在医学影像时序分析领域,TemMed-Bench数据集基于CheXpert Plus数据集的授权索引构建,通过整合多时间节点的医疗影像与临床记录形成样本。该数据集从斯坦福AIMI平台获取原始影像数据,并构建了包含历史病情信息的结构化测试集,其中1000个样本支撑三大任务模块,知识库另含17000个训练实例,严格遵循临床数据脱敏与标准化处理流程。
使用方法
使用者需首先从斯坦福AIMI官方平台下载原始CheXpert Plus影像数据,再加载本数据集提供的索引文件进行对齐。数据集提供四个配置模块:图像对选择、视觉问答与报告生成、精选问答子集及知识库训练集,可通过HuggingFace接口按需加载特定任务数据。测试时需注意模型应支持多图像输入与时序上下文理解,以充分发挥数据集的诊断推理价值。
背景与挑战
背景概述
医学影像时序分析作为智慧医疗的核心研究方向,旨在通过多时间点的影像数据追踪疾病演进轨迹。TemMed-Bench由加州大学洛杉矶分校研究团队于2023年推出,专注于解决跨时间维度的医学影像推理问题。该数据集基于斯坦福大学CheXpert Plus胸部X光数据库构建,包含千级测试样本和万级知识语料,通过整合历史病情信息与多影像输入,推动视觉-语言模型在临床决策支持系统中的应用,为动态病程评估提供了标准化评估框架。
当前挑战
该数据集直面医学影像时序推理的双重挑战:在领域层面,需解决跨时间点病灶变化检测、病情演进模式识别等动态分析难题,这对模型的时空关联建模能力提出极高要求;在构建层面,面临多中心影像数据标准化对齐、时序标注一致性校验等技术瓶颈,同时需严格遵守医疗数据隐私保护规范,通过数据索引与源文件分离的分布式架构实现合规访问。
常用场景
经典使用场景
在医学影像时序分析领域,TemMed-Bench数据集通过提供包含多次就诊记录的影像序列与对应诊断信息,为视觉语言模型构建了多维度的评估框架。其经典应用场景集中于模型对患者病情演变的纵向推理能力测试,要求系统不仅识别单次影像特征,更能通过对比历史与当前影像的细微变化,生成符合临床逻辑的时序诊断结论。
解决学术问题
该数据集有效解决了医学人工智能领域中时序推理的系统性评估难题,为多图像输入条件下的视觉语言模型提供了标准化测试基准。通过融合视觉问答、报告生成和图像对选择三重任务,它推动了模型在动态医学场景中的因果推断与跨模态融合能力研究,填补了传统静态影像分析在时间维度上的评估空白。
实际应用
临床实践中,TemMed-Bench支撑的模型可应用于放射科随访诊断辅助系统,通过自动比对患者历次CT或X光影像,生成结构化病情演进报告。这类系统能有效减轻医师工作负荷,提升慢性疾病监测效率,尤其在肿瘤进展评估、术后恢复追踪等需要长期影像对比的场景中展现显著价值。
数据集最近研究
最新研究方向
在医学影像人工智能领域,TemMed-Bench数据集正推动时序推理研究的前沿发展。该数据集通过整合多时间点的医学影像与临床信息,要求模型分析患者状态的动态演变,这直接呼应了临床实践中对疾病进展监测的迫切需求。当前研究热点集中于开发能够融合视觉-语言模态的时序推理架构,特别是在少样本学习与跨模态对齐方面取得显著突破。该数据集的推出为评估模型在真实医疗场景中的时序分析能力提供了重要基准,对推动可解释性AI在医疗诊断中的应用具有深远意义。
以上内容由遇见数据集搜集并总结生成



