table-vqa
收藏数据集概述
数据集信息
特征
- id: 字符串类型,唯一标识符。
- paper_id: 字符串类型,arXiv文章的唯一标识符。
- latex: 字符串类型,表格的LaTeX源代码。
- newcommands: 字符串序列,文章中使用的LaTeX新命令。
- image: 图像类型,表格的图像。
- model: 字符串类型,用于生成问答对的模型。
- qa: 结构体类型,包含英语和法语的问答对。
- en: 列表类型,包含英语的问答对。
- answer: 字符串类型,答案。
- question: 字符串类型,问题。
- fr: 列表类型,包含法语的问答对。
- answer: 字符串类型,答案。
- question: 字符串类型,问题。
- en: 列表类型,包含英语的问答对。
数据分割
- train: 训练集,包含16415个样本,大小为1260008177.905字节。
- test: 测试集,包含395个样本,大小为30186055字节。
数据集大小
- 下载大小: 1210970093字节。
- 数据集大小: 1290194232.905字节。
配置
- default: 默认配置。
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为
许可证
- apache-2.0
任务类别
- text-generation
- text-to-image
- image-to-text
- table-question-answering
- visual-question-answering
语言
- fr: 法语
- en: 英语
标签
- arXiv
- multimodal
- document-type objects
- table
大小类别
- 10K<n<100K
数据样本
json { "id": "786cc06c71854b088ca098fdf2cf20fa", "latex": "\begin{tabular}{|r|r|r|r|} \hline $\sqrt{s}$ (GeV) & $\phi$ (rad) & $\theta_{C}$ & $\theta_{AMH}$ \ \hline 250 & $0.444 \pm 0.070$ & $0.0497 \pm 0.0051$ & $0.36 \pm 0.10$ \ \hline \end{tabular}", "newcommands": [ "\newcommand{\toprule}{\hline}", "\newcommand{\midrule}{\hline}", "\newcommand{\bottomrule}{\hline}" ], "image": "<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=735x70 at 0x7F2420F56550>", "model": "claude3.5-sonnet", "qa": { "en": [ { "answer": "250 GeV", "question": "What is the center-of-mass energy in GeV for the data presented in the table?" }, { "answer": "0.444 ± 0.070 rad", "question": "What is the value of φ (phi) in radians according to the table?" }, { "answer": "4 significant figures", "question": "How many significant figures are reported for the θC (theta C) value?" }, { "answer": "θAMH (theta AMH) with a relative uncertainty of about 28%", "question": "Which parameter has the largest relative uncertainty in the table?" }, { "answer": "0.4097 (0.0497 + 0.36)", "question": "What is the sum of the central values of θC and θAMH?" } ], "fr": [ { "answer": "GeV (Giga-électronvolt)", "question": "Quelle est lunité de mesure utilisée pour √s dans le tableau?" }, { "answer": "0,36 ± 0,10", "question": "Quelle est la valeur de θAMH (theta AMH) indiquée dans le tableau?" }, { "answer": "4 paramètres", "question": "Combien de paramètres sont présentés dans ce tableau?" }, { "answer": "± 0,070 rad", "question": "Quelle est la précision de la mesure de φ (phi) en radians?" }, { "answer": "θC (theta C) avec une incertitude de ± 0,0051", "question": "Quel paramètre a la plus petite incertitude absolue dans le tableau?" } ] } }
统计描述
语言分布
| Split | Language | # images | # Q/A pairs | # Words |
|---|---|---|---|---|
| train | en | 16,415 | 83,686 | 1,499,367 |
| train | fr | 16,415 | 83,640 | 1,697,110 |
| train | Total | 16,415 | 167,326 | 3,196,477 |
| test | en | 395 | 2,015 | 35,706 |
| test | fr | 395 | 2,015 | 40,475 |
| test | Total | 395 | 4,030 | 76,181 |
模型使用分布
| Split | Model | # images | # en Q/A pairs | # fr Q/A pairs | # total Q/A pairs |
|---|---|---|---|---|---|
| train | Claude | 5539 | 27695 | 27695 | 55,390 |
| train | Gemini | 5444 | 27384 | 27285 | 54,669 |
| train | GPT4o | 5432 | 28607 | 28660 | 57,267 |
| test | Claude | 107 | 535 | 535 | 83,686 |
| test | Gemini | 139 | 695 | 695 | 83,640 |
| test | GPT4o | 149 | 785 | 785 | 24,452 |
字段描述
- id: 唯一标识符。
- image: 表格的Pillow图像。
- latex: 表格的LaTeX源代码。
- model: 用于生成问答对的模型(
claude3.5-sonnet,gemini-1.5-pro或gpt-4o)。 - paper_id: 文章的唯一arXiv标识符。
- newcommands: 文章中使用的LaTeX新命令列表。
- qa: 包含英语和法语问答对的字典。




