NgTMDuc/VLLM_ChartQA_split
收藏Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NgTMDuc/VLLM_ChartQA_split
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置文件,每个配置文件对应不同的数据分割(如训练集、测试集、验证集)。每个配置文件包含以下特征:id_image(图像ID)、image(图像)、table(表格数据)、chart_type(图表类型)、qa(问答对,包含标签和查询)、vi_qa(视觉问答对,包含标签和查询)、gemini_response(Gemini模型的响应)。数据集的总大小和下载大小也在文件中进行了详细说明。
The dataset includes multiple configurations, each containing features such as id_image, image, table, chart_type, qa, vi_qa, and gemini_response. The dataset is divided into test, train, and validation sets, each with varying numbers of examples and sizes. The features include both textual and image data, indicating a dataset suitable for tasks involving visual and textual analysis.
提供机构:
NgTMDuc
原始信息汇总
数据集概述
本数据集包含多个配置,每个配置对应不同的数据分割和特征。以下是各配置的主要信息:
配置1: test_00000-of-00002
- 特征:
- id_image: 字符串
- image: 图像
- table: 字符串
- chart_type: 字符串
- qa: 列表,包含label和query,均为字符串
- vi_qa: 列表,包含label和query,均为字符串
- gemini_response: 字符串
- 分割:
- test: 1000个示例,数据大小44620507.0字节,下载大小43346667字节
配置2: test_00001-of-00002
- 特征: 同配置1
- 分割:
- test: 509个示例,数据大小22623387.0字节,下载大小21974645字节
配置3: train_00000-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46777012.0字节,下载大小45487627字节
配置4: train_00001-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46341926.0字节,下载大小45190617字节
配置5: train_00002-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小47718072.0字节,下载大小46845469字节
配置6: train_00003-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46697570.0字节,下载大小45757068字节
配置7: train_00004-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小48351888.0字节,下载大小47344864字节
配置8: train_00005-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46706414.0字节,下载大小45732306字节
配置9: train_00006-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46989728.0字节,下载大小45979988字节
配置10: train_00007-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小47486058.0字节,下载大小46444890字节
配置11: train_00008-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46682627.0字节,下载大小45743793字节
配置12: train_00009-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46229349.0字节,下载大小45332738字节
配置13: train_00010-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46182217.0字节,下载大小45329950字节
配置14: train_00011-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小47076999.0字节,下载大小46034788字节
配置15: train_00012-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小47309985.0字节,下载大小46317955字节
配置16: train_00013-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小45437168.0字节,下载大小44576734字节
配置17: train_00014-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小48498500.0字节,下载大小47349887字节
配置18: train_00015-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46516986.0字节,下载大小45482173字节
配置19: train_00016-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小47650293.0字节,下载大小46502713字节
配置20: train_00017-of-00019
- 特征: 同配置1
- 分割:
- train: 1000个示例,数据大小46938349.0字节,下载大小46036798字节
配置21: train_00018-of-00019
- 特征: 同配置1
- 分割:
- train: 317个示例,数据大小15057603.0字节,下载大小14713698字节
配置22: validation_00000-of-00002
- 特征: 同配置1
- 分割:
- validation: 1000个示例,数据大小45908891.0字节,下载大小44648563字节
配置23: validation_00001-of-00002
- 特征: 同配置1
- 分割:
- validation: 56个示例,数据大小2460671.0字节,下载大小2409285字节
每个配置的特征包括图像、表格、图表类型、问答列表和Gemini响应,适用于不同的数据分割需求。



