five

NgTMDuc/VLLM_ChartQA_split

收藏
Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NgTMDuc/VLLM_ChartQA_split
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置文件,每个配置文件对应不同的数据分割(如训练集、测试集、验证集)。每个配置文件包含以下特征:id_image(图像ID)、image(图像)、table(表格数据)、chart_type(图表类型)、qa(问答对,包含标签和查询)、vi_qa(视觉问答对,包含标签和查询)、gemini_response(Gemini模型的响应)。数据集的总大小和下载大小也在文件中进行了详细说明。

The dataset includes multiple configurations, each containing features such as id_image, image, table, chart_type, qa, vi_qa, and gemini_response. The dataset is divided into test, train, and validation sets, each with varying numbers of examples and sizes. The features include both textual and image data, indicating a dataset suitable for tasks involving visual and textual analysis.
提供机构:
NgTMDuc
原始信息汇总

数据集概述

本数据集包含多个配置,每个配置对应不同的数据分割和特征。以下是各配置的主要信息:

配置1: test_00000-of-00002

  • 特征:
    • id_image: 字符串
    • image: 图像
    • table: 字符串
    • chart_type: 字符串
    • qa: 列表,包含label和query,均为字符串
    • vi_qa: 列表,包含label和query,均为字符串
    • gemini_response: 字符串
  • 分割:
    • test: 1000个示例,数据大小44620507.0字节,下载大小43346667字节

配置2: test_00001-of-00002

  • 特征: 同配置1
  • 分割:
    • test: 509个示例,数据大小22623387.0字节,下载大小21974645字节

配置3: train_00000-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46777012.0字节,下载大小45487627字节

配置4: train_00001-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46341926.0字节,下载大小45190617字节

配置5: train_00002-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小47718072.0字节,下载大小46845469字节

配置6: train_00003-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46697570.0字节,下载大小45757068字节

配置7: train_00004-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小48351888.0字节,下载大小47344864字节

配置8: train_00005-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46706414.0字节,下载大小45732306字节

配置9: train_00006-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46989728.0字节,下载大小45979988字节

配置10: train_00007-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小47486058.0字节,下载大小46444890字节

配置11: train_00008-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46682627.0字节,下载大小45743793字节

配置12: train_00009-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46229349.0字节,下载大小45332738字节

配置13: train_00010-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46182217.0字节,下载大小45329950字节

配置14: train_00011-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小47076999.0字节,下载大小46034788字节

配置15: train_00012-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小47309985.0字节,下载大小46317955字节

配置16: train_00013-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小45437168.0字节,下载大小44576734字节

配置17: train_00014-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小48498500.0字节,下载大小47349887字节

配置18: train_00015-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46516986.0字节,下载大小45482173字节

配置19: train_00016-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小47650293.0字节,下载大小46502713字节

配置20: train_00017-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 1000个示例,数据大小46938349.0字节,下载大小46036798字节

配置21: train_00018-of-00019

  • 特征: 同配置1
  • 分割:
    • train: 317个示例,数据大小15057603.0字节,下载大小14713698字节

配置22: validation_00000-of-00002

  • 特征: 同配置1
  • 分割:
    • validation: 1000个示例,数据大小45908891.0字节,下载大小44648563字节

配置23: validation_00001-of-00002

  • 特征: 同配置1
  • 分割:
    • validation: 56个示例,数据大小2460671.0字节,下载大小2409285字节

每个配置的特征包括图像、表格、图表类型、问答列表和Gemini响应,适用于不同的数据分割需求。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作