vidore/tabfquad_test_subsampled
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/tabfquad_test_subsampled
下载链接
链接失效反馈官方服务:
资源简介:
TabFQuAD(表格法语问答数据集)旨在评估现实工业环境中的TableQA模型。通过使用视觉语言模型(GPT4V),我们创建了额外的查询以增强现有的人工注释数据。数据集包含280个测试样本,每个样本包含查询、图像文件名、生成者、GPT4生成的标题、图像和来源等特征。数据集支持法语和英语,适用于表格问答和视觉问答任务。
TabFQuAD (Table French Question Answering Dataset) is designed to evaluate TableQA models in realistic industry settings. Using a vision language model (GPT4V), we create additional queries to augment the existing human-annotated ones. The dataset contains 280 test samples, each including features such as query, image filename, generated by, GPT4 caption, image, and source. The dataset supports French and English and is suitable for table question answering and visual question answering tasks.
提供机构:
vidore
原始信息汇总
数据集概述
数据集信息
- 名称: TabFQuAD (Table French Question Answering Dataset)
- 任务类别:
- 表格问答
- 视觉问答
- 语言:
- 法语
- 英语
- 标签:
- 检索
- 多模态
- 表格检索
- 视觉问答
- 问答
- 大小类别: n<1K
- 许可证: MIT
数据集结构
- 特征:
query: 字符串类型image_filename: 字符串类型generated_by: 字符串类型GPT4 caption: 字符串类型image: 图像类型source: 字符串类型
数据集分割
- 测试集:
- 样本数量: 280
- 数据大小: 36916696.161572054 字节
数据集加载
python from datasets import load_dataset ds = load_dataset("vidore/tabfquad_test_subsampled", split="test")



