five

HuggingFaceM4/VQAv2|视觉问答数据集|机器学习数据集

收藏
hugging_face2022-06-30 更新2024-03-04 收录
视觉问答
机器学习
下载链接:
https://hf-mirror.com/datasets/HuggingFaceM4/VQAv2
下载链接
链接失效反馈
资源简介:
该数据集是一个视觉问答(VQA)数据集,包含训练、验证和测试集的问题、答案和图像数量统计。具体包括:训练集问题443,757个,验证集问题214,354个,测试集问题447,793个;训练集答案4,437,570个,验证集答案2,143,540个;训练集图像82,783张,验证集图像40,504张,测试集图像81,434张。此外,还包含一个未明确提及的testdev数据集,包含107,394个问题和36,807张图像。
提供机构:
HuggingFaceM4
原始信息汇总

数据集概述

训练集(Train)

  • 问题数量:443,757
  • 答案数量:4,437,570
  • 图像数量:82,783

验证集(Val)

  • 问题数量:214,354
  • 答案数量:2,143,540
  • 图像数量:40,504

测试集(Test)

  • 问题数量:447,793
  • 图像数量:81,434

测试开发集(Testdev)

  • 问题数量:107,394
  • 图像数量:36,807
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

ChemBL

ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。

www.ebi.ac.uk 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录