five

WikiMixQA

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/phucty/wtabhtml
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为WikiMixQA,是一个包含1000个多项选择题的基准测试,旨在评估模型在跨越7000个维基百科页面中提取的表格和图表上进行跨模态推理的能力。这些页面涵盖了七个不同的话题。该数据集强调复杂的推理能力,要求模型从多种模态中综合信息,并包含一个用于文档分类的自定义分类法。其规模包括7258个文档和3528个问题-答案对,任务类型为问答。

This dataset, named WikiMixQA, is a benchmark comprising 1,000 multiple-choice questions, designed to evaluate models' cross-modal reasoning capabilities on tables and charts extracted from over 7,000 Wikipedia pages. These pages cover seven distinct topics. This dataset emphasizes complex reasoning abilities, requiring models to synthesize information across multiple modalities, and includes a custom taxonomy for document classification. In terms of scale, it contains 7,258 documents and 3,528 question-answer pairs, with the task type being question answering.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作