WorldMedQA-V
收藏WorldMedQA-V: 多语言、多模态医学考试数据集
概述
WorldMedQA-V 是一个多语言和多模态的基准数据集,旨在评估视觉-语言模型(VLM)在医疗环境中的表现。该数据集包含来自巴西、以色列、日本和西班牙的医学考试问题,涵盖原始语言和英语翻译。每个多项选择题都配有一张相应的医学图像,允许对VLM在多模态数据上的表现进行全面评估。
主要特点:
- 多语言: 支持本地语言(葡萄牙语、希伯来语、日语和西班牙语)以及英语翻译。
- 多模态: 每个问题都附有一张医学图像,允许对VLM在文本和视觉输入上的表现进行综合评估。
- 临床验证: 所有问题和答案均由相应国家的母语临床医生审查和验证。
数据集详情
- 问题数量: 568
- 覆盖国家: 巴西、以色列、日本、西班牙
- 语言: 葡萄牙语、希伯来语、日语、西班牙语和英语
- 数据类型: 带医学图像的多项选择题
- 评估: 模型在本地语言和英语中的表现,以及是否使用医学图像
该数据集旨在弥合现实世界医疗环境与AI评估之间的差距,促进更公平、有效和具有代表性的应用。
数据结构
数据集以TSV格式提供,结构如下:
- ID: 每个问题的唯一标识符。
- 问题: 本地语言的医学多项选择题。
- 选项: 可能答案的列表(A-D)。
- 正确答案: 正确答案的标签。
- 图像路径: 相应医学图像的路径(如果适用)。
- 语言: 问题的语言(原始或英语翻译)。
巴西示例:
- 问题: Um paciente do sexo masculino, 55 anos de idade, tabagista 60 maços/ano... [完整医学问题见下文]
- 选项:
- A: Aspergilose pulmonar
- B: Carcinoma pulmonar
- C: Tuberculose cavitária
- D: Bronquiectasia com infecção
- 正确答案: B <img src="src/example.png" alt="example" width="800"/>
下载和使用
数据集可从Hugging Face数据集页面下载。处理和评估数据集的所有代码可在以下仓库中找到:
- 数据集代码: WorldMedQA GitHub仓库
- 评估代码: VLMEvalKit GitHub仓库
如何开始: Google Colab演示
引用
请使用我们的arXiv预印本引用此数据集:
bibtex @misc{WorldMedQA-V2024, title={WorldMedQA-V: a multilingual, multimodal medical examination dataset for multimodal language models evaluation}, author={João Matos and Shan Chen and Siena Placino and Yingya Li and Juan Carlos Climent Pardo and Daphna Idan and Takeshi Tohyama and David Restrepo and Luis F. Nakayama and Jose M. M. Pascual-Leone and Guergana Savova and Hugo Aerts and Leo A. Celi and A. Ian Wong and Danielle S. Bitterman and Jack Gallifant}, year={2024}, eprint={2410.12722}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2410.12722}, }




