xmcmic/PMC-VQA
收藏Hugging Face2024-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xmcmic/PMC-VQA
下载链接
链接失效反馈官方服务:
资源简介:
PMC-VQA数据集是一个用于医学视觉问答(VQA)任务的数据集,包含两个版本。版本1包含227k个视觉问答对和149k张图像,版本2则包含非复合图像。数据集文件包括训练集、测试集和图像文件夹。每个样本包含图像路径、问题、答案、选项和答案标签。数据集基于PMC开放获取子集的‘允许商业使用’部分,并遵循CC BY-SA许可证,以支持医学生成式VQA模型的开发。
The PMC-VQA dataset is a dataset for the medical visual question answering (VQA) task, which includes two versions. Version 1 contains 227,000 visual question-answer pairs and 149,000 images, while Version 2 contains non-compound images. The dataset files comprise the training set, test set, and image folder. Each sample contains an image path, question, answer, options, and answer label. The dataset is based on the "allow commercial use" section of the PMC Open Access Subset, and adheres to the CC BY-SA license to support the development of medical generative VQA models.
提供机构:
xmcmic
原始信息汇总
PMC-VQA Dataset
数据集结构
-
版本1: 包含227k个VQA对,对应149k张图片。
train.csv: 训练集元文件test.csv: 测试集元文件test_clean.csv: 测试清洁集元文件images.zip: 图片文件夹
-
版本2: 非复合图像
train2.csv: 训练集元文件test2.csv: 测试集元文件images2.zip: 图片文件夹
样本
train.csv 中的一行示例:
| 字段名 | 值 |
|---|---|
| Figure_path | PMC1064097_F1.jpg |
| Question | What is the uptake pattern in the breast? |
| Answer | Focal uptake pattern |
| Choice A | A:Diffuse uptake pattern |
| Choice B | B:Focal uptake pattern |
| Choice C | C:No uptake pattern |
| Choice D | D:Cannot determine from the information given |
| Answer_label | B |
字段解释
- Figure_path: 图片路径
- Question: 对应图片的问题
- Answer: 对应图片的正确答案
- Choice A: 提供的选项A
- Choice B: 提供的选项B
- Choice C: 提供的选项C
- Choice D: 提供的选项D
- Answer_label: 正确答案标签
搜集汇总
数据集介绍

背景与挑战
背景概述
PMC-VQA是一个大规模的医学视觉问答数据集,包含22.7万个问题-答案对和14.9万张医学图像,涵盖多种医学影像类型和问题类型。数据集基于PubMed Central开放获取论文构建,遵循CC BY-SA许可协议,旨在支持医学领域的生成式VQA模型开发。
以上内容由遇见数据集搜集并总结生成



