openmed-community/multicare-cases
收藏Hugging Face2025-09-07 更新2025-09-13 收录
下载链接:
https://hf-mirror.com/datasets/openmed-community/multicare-cases
下载链接
链接失效反馈官方服务:
资源简介:
MultiCaRe是一个开源的多模态临床案例数据集,从PubMed Central的开放获取案例报告文章中提取而来。它将去识别的案例叙述与图像/标题和文章级元数据链接起来,实现了跨模态监督和检索。数据集包含了超过85k篇文章,提及110k+患者和160k+图像。支持的任务包括案例叙述分类、检索、总结;以及带有图像连接的多模态建模和带有图像引用的VQA/doc-QA。
MultiCaRe is an open-source, multimodal clinical case dataset derived from PubMed Centrals Open Access Case Report articles. It links de-identified case narratives to figure images/captions and article-level metadata, enabling cross-modal supervision and retrieval. The dataset includes over 85k articles, mentioning 110k+ patients and 160k+ images. Tasks supported include narrative classification, retrieval, summarization; multimodal modeling with image joins; and VQA/doc-QA with figure references.
提供机构:
openmed-community
搜集汇总
数据集介绍

背景与挑战
背景概述
MultiCaRe-Cases是一个开源的临床病例文本数据集,包含超过85,000条从PubMed Central开放获取案例报告中提取的病例叙述,每条记录包括病例文本、年龄和性别等信息。该数据集专为医疗文本分类和检索任务设计,支持通过病例ID与图像数据集进行多模态关联分析,适用于医疗自然语言处理研究。
以上内容由遇见数据集搜集并总结生成



