five

GRAB|图表分析数据集|多模态模型数据集

收藏
arXiv2024-08-22 更新2024-08-23 收录
图表分析
多模态模型
下载链接:
https://grab-benchmark.github.io
下载链接
链接失效反馈
资源简介:
GRAB是由剑桥大学和香港大学联合创建的图表分析基准数据集,旨在评估大型多模态模型在图表分析任务中的性能。该数据集包含2170个合成生成的图表分析问题,覆盖四个核心任务和23个图表属性。数据集通过Matplotlib库合成生成,确保了高质量和无噪声的问题。GRAB主要应用于提升大型多模态模型在图表分析领域的性能,特别是在无法访问图表底层数据的情况下,通过视觉解释进行数据分析的能力。
提供机构:
剑桥大学, 香港大学
创建时间:
2024-08-22
AI搜集汇总
数据集介绍
main_image_url
构建方式
GRAB数据集通过Matplotlib库合成生成,确保了高质量和无噪声的问题。该数据集包含2170个问题,涵盖四个任务和23个图表属性。合成生成的方法允许对问题的复杂性进行精确控制,避免了后期标注可能引入的错误,并确保了问题的多样性和可控性。
特点
GRAB数据集的特点在于其高难度和合成生成的特性,这使得它成为评估前沿多模态模型在图表分析任务中表现的重要工具。数据集中的问题设计旨在挑战模型的极限,涵盖了从基本属性到复杂变换的广泛内容,确保了评估的全面性和深度。
使用方法
使用GRAB数据集时,研究人员可以通过简单的用户提示策略进行模型评估,确保模型在遵循任务和输出指令方面的能力得到全面测试。评估方法采用精确匹配协议,确保输出与预期答案完全一致,从而综合评估模型的任务执行能力和指令遵循能力。
背景与挑战
背景概述
随着计算资源的增加、研究社区的迅速扩展以及商业机会的激增,前沿多模态模型(LMMs)的能力正在快速提升和扩展。然而,随着模型性能的提高,现有的基准测试逐渐饱和,无法有效区分模型的能力。为了应对这一挑战,Jonathan Roberts、Kai Han和Samuel Albanie等人于2024年推出了GRAB(GRaph Analysis Benchmark)数据集。该数据集专注于图表分析任务,旨在为当前和未来的前沿LMMs提供一个具有挑战性的基准。GRAB数据集包含2170个问题,涵盖四个核心任务和23个图表属性,通过合成数据生成,确保问题的高质量和无噪声。该数据集的发布旨在推动多模态模型在图表分析领域的发展,并为模型的评估提供新的标准。
当前挑战
GRAB数据集面临的挑战主要来自两个方面。首先,图表分析任务本身具有较高的复杂性,要求模型能够准确理解和解析图表中的数据,包括估计均值、截距、相关系数等。其次,数据集的构建过程中,合成数据的生成和问题的编排需要精确控制,以确保问题的难度和多样性。此外,当前的多模态模型在处理GRAB数据集时表现不佳,最高得分仅为21.7%,显示出模型在精确遵循输出格式和复杂推理能力方面的不足。这些挑战要求研究者在模型设计和训练方法上进行创新,以提升多模态模型在图表分析任务中的表现。
常用场景
经典使用场景
GRAB数据集的经典使用场景在于评估大型多模态模型在图表分析任务中的表现。通过提供2170个合成生成的图表分析问题,涵盖四个核心任务和23个图表属性,GRAB旨在测试模型在估计函数参数、计算统计量以及处理图表变换等方面的能力。
解决学术问题
GRAB数据集解决了当前多模态模型在图表分析任务中面临的挑战,特别是现有基准测试的不足。通过提供高质量、无噪声的合成数据,GRAB确保了问题的复杂性和多样性,从而推动了新一代多模态模型的发展。其意义在于为学术界提供了一个标准化的评估工具,促进了模型在复杂图表分析任务中的性能提升。
衍生相关工作
GRAB数据集的发布激发了相关领域的研究工作,推动了多模态模型在图表分析任务中的进一步发展。例如,一些研究可能专注于改进模型的图表解读能力,通过引入更复杂的图表类型或增加问题的难度。此外,GRAB还可能催生新的评估方法和基准测试,以更全面地评估多模态模型在不同任务中的表现。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中指数据库(物业版)

物业版解决物业企业“找项目”、“找行业和企业数据"的迫切需求,提供高效的市场拓展渠道、最新行业动态、竞品企业的多维度数据,助力企业科学决策。

西部数据交易中心 收录

马达加斯加岛 – 世界地理数据大百科辞条

马达加斯加岛在非洲的东南部,位于11o56′59″S - 25o36′25″S及43o11′18″E - 50o29′36″E之间。通过莫桑比克海峡与位于非洲大陆的莫桑比克相望,最近距离为415千米。临近的岛屿分别为西北部的科摩罗群岛、北部的塞舌尔群岛、东部的毛里求斯岛和留尼汪岛等。在google earth 2015年遥感影像基础上研发的马达加斯加海岸线数据集表明,马达加斯加岛面积591,128.68平方千米,其中马达加斯加本岛面积589,015.06平方千米,周边小岛面积为2,113.62平方千米。马达加斯加本岛是非洲第一大岛,是仅次于格陵兰、新几内亚岛和加里曼丹岛的世界第四大岛屿。岛的形状呈南北走向狭长纺锤形,南北向长1,572千米;南北窄,中部宽,最宽处达574千米。海岸线总长16,309.27千米, 其中马达加斯加本岛海岸线长10,899.03千米,周边小岛海岸线长5,410.24千米。马达加斯加岛属于马达加斯加共和国。全国共划分22个区,119个县。22个区分别为:阿那拉芒加区,第亚那区,上马齐亚特拉区,博爱尼区,阿齐那那那区,阿齐莫-安德列发那区,萨瓦区,伊达西区,法基南卡拉塔区,邦古拉法区,索非亚区,贝齐博卡区,梅拉基区,阿拉奥特拉-曼古罗区,阿那拉兰基罗富区,阿莫罗尼马尼亚区,法土法韦-非图韦那尼区,阿齐莫-阿齐那那那区,伊霍罗贝区,美那贝区,安德罗伊区和阿诺西区。首都安塔那那利佛(Antananarivo)位于岛屿的中东部。马达加斯加岛是由火山及喀斯特地貌为主。贯穿海岛的是巨大火山岩山体-察腊塔纳山,其主峰马鲁穆库特鲁山(Maromokotro)海拔2,876米,是全国最高峰。马达加斯加自然景观垂直地带性分异显著,是热带雨林和热带草原广布的地区。岛上大约有20多万种动植物,其中包括马达加斯加特有物种狐猴(Lemur catta)、马达加斯加国树猴面包树(Adansonia digitata L.)等。

国家对地观测科学数据中心 收录

Materials Project 在线材料数据库

Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。

超神经 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

轴承故障数据集

本项目集成了多个公开的轴承故障数据集,所有数据均被处理为1秒/个的数据样本,并使用fft得到其频域特征。支持通过数据集、通道、故障、严重程度对所有样本进行筛选,并选择时域或频域显示。

github 收录