five

xmcmic/PMC-VQA

收藏
Hugging Face2024-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xmcmic/PMC-VQA
下载链接
链接失效反馈
官方服务:
资源简介:
PMC-VQA数据集是一个用于医学视觉问答(VQA)任务的数据集,包含两个版本。版本1包含227k个视觉问答对和149k张图像,版本2则包含非复合图像。数据集文件包括训练集、测试集和图像文件夹。每个样本包含图像路径、问题、答案、选项和答案标签。数据集基于PMC开放获取子集的‘允许商业使用’部分,并遵循CC BY-SA许可证,以支持医学生成式VQA模型的开发。

The PMC-VQA dataset is a dataset for the medical visual question answering (VQA) task, which includes two versions. Version 1 contains 227,000 visual question-answer pairs and 149,000 images, while Version 2 contains non-compound images. The dataset files comprise the training set, test set, and image folder. Each sample contains an image path, question, answer, options, and answer label. The dataset is based on the "allow commercial use" section of the PMC Open Access Subset, and adheres to the CC BY-SA license to support the development of medical generative VQA models.
提供机构:
xmcmic
原始信息汇总

PMC-VQA Dataset

数据集结构

  • 版本1: 包含227k个VQA对,对应149k张图片。

    • train.csv: 训练集元文件
    • test.csv: 测试集元文件
    • test_clean.csv: 测试清洁集元文件
    • images.zip: 图片文件夹
  • 版本2: 非复合图像

    • train2.csv: 训练集元文件
    • test2.csv: 测试集元文件
    • images2.zip: 图片文件夹

样本

train.csv 中的一行示例:

字段名
Figure_path PMC1064097_F1.jpg
Question What is the uptake pattern in the breast?
Answer Focal uptake pattern
Choice A A:Diffuse uptake pattern
Choice B B:Focal uptake pattern
Choice C C:No uptake pattern
Choice D D:Cannot determine from the information given
Answer_label B

字段解释

  • Figure_path: 图片路径
  • Question: 对应图片的问题
  • Answer: 对应图片的正确答案
  • Choice A: 提供的选项A
  • Choice B: 提供的选项B
  • Choice C: 提供的选项C
  • Choice D: 提供的选项D
  • Answer_label: 正确答案标签
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
PMC-VQA是一个大规模的医学视觉问答数据集,包含22.7万个问题-答案对和14.9万张医学图像,涵盖多种医学影像类型和问题类型。数据集基于PubMed Central开放获取论文构建,遵循CC BY-SA许可协议,旨在支持医学领域的生成式VQA模型开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作