five

vidore/tabfquad_test_subsampled

收藏
Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/tabfquad_test_subsampled
下载链接
链接失效反馈
官方服务:
资源简介:
TabFQuAD(表格法语问答数据集)旨在评估现实工业环境中的TableQA模型。通过使用视觉语言模型(GPT4V),我们创建了额外的查询以增强现有的人工注释数据。数据集包含280个测试样本,每个样本包含查询、图像文件名、生成者、GPT4生成的标题、图像和来源等特征。数据集支持法语和英语,适用于表格问答和视觉问答任务。

TabFQuAD (Table French Question Answering Dataset) is designed to evaluate TableQA models in realistic industry settings. Using a vision language model (GPT4V), we create additional queries to augment the existing human-annotated ones. The dataset contains 280 test samples, each including features such as query, image filename, generated by, GPT4 caption, image, and source. The dataset supports French and English and is suitable for table question answering and visual question answering tasks.
提供机构:
vidore
原始信息汇总

数据集概述

数据集信息

  • 名称: TabFQuAD (Table French Question Answering Dataset)
  • 任务类别:
    • 表格问答
    • 视觉问答
  • 语言:
    • 法语
    • 英语
  • 标签:
    • 检索
    • 多模态
    • 表格检索
    • 视觉问答
    • 问答
  • 大小类别: n<1K
  • 许可证: MIT

数据集结构

  • 特征:
    • query: 字符串类型
    • image_filename: 字符串类型
    • generated_by: 字符串类型
    • GPT4 caption: 字符串类型
    • image: 图像类型
    • source: 字符串类型

数据集分割

  • 测试集:
    • 样本数量: 280
    • 数据大小: 36916696.161572054 字节

数据集加载

python from datasets import load_dataset ds = load_dataset("vidore/tabfquad_test_subsampled", split="test")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作