Multimodal ArXiv 科学理解数据集
收藏超神经2024-08-14 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/33411
下载链接
链接失效反馈官方服务:
资源简介:
Multimodal ArXiv 由香港大学和北京大学于 2024 年推出,相关论文为「Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models」,该成果已被 ACL 2024 接受。
多模态ArXiv(Multimodal ArXiv)由香港大学与北京大学于2024年发布,相关研究论文为《多模态ArXiv:提升大视觉语言模型(Large Vision-Language Models)科学理解能力的数据集》(Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models),该研究成果已被ACL 2024接收。
创建时间:
2024-08-14
搜集汇总
数据集介绍

背景与挑战
背景概述
Multimodal ArXiv 是由香港大学和北京大学于2024年推出的数据集,旨在提升大型视觉语言模型的科学理解能力。它包含来自arXiv论文的ArXivCap图文数据集,以及基于此生成的ArXivQA问答数据集,后者能显著增强模型在数学推理任务上的表现。
以上内容由遇见数据集搜集并总结生成



