five

VARAG/ArxivQADataset

收藏
Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/VARAG/ArxivQADataset
下载链接
链接失效反馈
官方服务:
资源简介:
ArxivQA是一个基于Arxiv论文中的图表生成的GPT4V视觉问答(VQA)样本集。该数据集主要用于大型多模态模型的研究,目标用户包括计算机视觉、自然语言处理、机器学习和人工智能领域的研究人员和爱好者。

ArxivQA是一个基于Arxiv论文中的图表生成的GPT4V视觉问答(VQA)样本集。该数据集主要用于大型多模态模型的研究,目标用户包括计算机视觉、自然语言处理、机器学习和人工智能领域的研究人员和爱好者。
提供机构:
VARAG
原始信息汇总

数据集概述

基本信息

  • 数据集名称: ArxivQA
  • 数据集类型: 基于Arxiv论文图表的GPT4V生成视觉问答样本集
  • 许可证: CC-BY-SA-4.0
  • 语言: 英语
  • 任务类别: 图像到文本
  • 标签: 视觉-语言, VQA
  • 大小范围: 10K<n<100K

数据集内容

  • 文件格式: arxivqa.jsonl 包含每行一个样本的JSON格式数据
  • 样本结构: 每个样本包含ID、图像路径、选项、问题、标签和理由
  • 图像文件: 图像文件需通过images.tgz解压获取

使用指南

  • 下载: 下载arxivqa.jsonimages.tgz到本地
  • 解压图像: 使用命令tar -xzvf images.tgz解压图像文件
  • 加载数据集: 使用Python代码加载和处理数据集样本

目的与用户

  • 主要用途: 用于研究大型多模态模型
  • 主要用户: 计算机视觉、自然语言处理、机器学习和人工智能领域的研究人员和爱好者
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作