Multimodal ArXiv 科学理解数据集

超神经2024-08-14 更新2024-12-14 收录

下载链接：

https://hyper.ai/cn/datasets/33411

下载链接

链接失效反馈

官方服务：

资源简介：

Multimodal ArXiv 由香港大学和北京大学于 2024 年推出，相关论文为「Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models」，该成果已被 ACL 2024 接受。

多模态ArXiv（Multimodal ArXiv）由香港大学与北京大学于2024年发布，相关研究论文为《多模态ArXiv：提升大视觉语言模型（Large Vision-Language Models）科学理解能力的数据集》（Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models），该研究成果已被ACL 2024接收。

创建时间：

2024-08-14

搜集汇总

数据集介绍

背景与挑战

背景概述

Multimodal ArXiv 是由香港大学和北京大学于2024年推出的数据集，旨在提升大型视觉语言模型的科学理解能力。它包含来自arXiv论文的ArXivCap图文数据集，以及基于此生成的ArXivQA问答数据集，后者能显著增强模型在数学推理任务上的表现。

以上内容由遇见数据集搜集并总结生成