five

AI4Math/MathVista|数学推理数据集|多模态问答数据集

收藏
hugging_face2024-02-11 更新2024-03-04 收录
数学推理
多模态问答
下载链接:
https://hf-mirror.com/datasets/AI4Math/MathVista
下载链接
链接失效反馈
资源简介:
MathVista是一个整合了视觉上下文中的数学推理基准。它包含了三个新创建的数据集:IQTest、FunctionQA和PaperQA,这些数据集旨在评估在拼图测试图上的逻辑推理、函数图上的代数推理以及学术论文图上的科学推理。此外,MathVista还整合了9个MathQA数据集和19个VQA数据集,这些数据集显著丰富了视觉感知和数学推理挑战的多样性和复杂性。MathVista总共包含了来自31个不同数据集的6,141个示例。

MathVista是一个整合了视觉上下文中的数学推理基准。它包含了三个新创建的数据集:IQTest、FunctionQA和PaperQA,这些数据集旨在评估在拼图测试图上的逻辑推理、函数图上的代数推理以及学术论文图上的科学推理。此外,MathVista还整合了9个MathQA数据集和19个VQA数据集,这些数据集显著丰富了视觉感知和数学推理挑战的多样性和复杂性。MathVista总共包含了来自31个不同数据集的6,141个示例。
提供机构:
AI4Math
原始信息汇总

数据集概述

MathVista 是一个专注于数学推理在视觉环境中应用的基准数据集。该数据集包含三个新创建的数据集:IQTest, FunctionQA, 和 PaperQA,以及从文献中整合的9个MathQA数据集和19个VQA数据集,共计6,141个示例,来自31个不同的数据集。

数据集特性

  • 语言: 包含英语(en)、中文(zh)和波斯语(fa)。
  • 许可证: 使用CC BY-SA 4.0许可证。
  • 多语言性: 支持单语种数据。
  • 大小分类: 数据集大小介于1,000到10,000之间。
  • 任务类别: 包括多项选择、问答、视觉问答和文本分类。
  • 任务ID: 涵盖多项选择问答、封闭领域问答、开放领域问答、视觉问答和多类分类。
  • 标签创建者: 包括专家生成和发现的数据。
  • 语言创建者: 同样包括专家生成和发现的数据。

数据集结构

  • 特征:

    • pid: 字符串类型,问题ID。
    • question: 字符串类型,问题文本。
    • image: 字符串类型,图像路径。
    • decoded_image: 图像类型,解码后的图像。
    • choices: 字符串序列,选择项。
    • unit: 字符串类型,答案单位。
    • precision: 浮点数类型,答案精度。
    • answer: 字符串类型,正确答案。
    • question_type: 字符串类型,问题类型。
    • answer_type: 字符串类型,答案类型。
    • metadata: 结构化数据,包含类别、上下文、年级、图像高度和宽度、语言、技能、来源、分割和任务等信息。
    • query: 字符串类型,查询文本。
  • 分割:

    • testmini: 包含1,000个示例,用于模型开发和验证。
    • test: 包含5,141个示例,用于标准评估。

数据集下载和使用

数据集可以通过Huggingface Datasets库下载,并提供了详细的JSON格式数据结构说明,方便用户理解和使用。

数据集标签和来源

数据集的标签包括专家生成和发现的数据,来源包括原始数据集和其他28个数据集。所有数据都已预处理和标注,以供评估使用。

AI搜集汇总
数据集介绍
main_image_url
构建方式
MathVista数据集的构建融合了专家生成和现有资源,涵盖了三个新创建的数据集:IQTest、FunctionQA和PaperQA,以及从文献中整合的9个MathQA数据集和19个VQA数据集。这些数据集共同构成了一个包含6,141个示例的综合数学推理基准,旨在评估在视觉上下文中的逻辑推理能力。
特点
MathVista数据集的显著特点在于其多模态性质,结合了文本和图像信息,涵盖了多种数学推理技能,如算术、代数、几何和科学推理等。此外,数据集支持多种语言,包括英语、中文和波斯语,增强了其跨文化应用的潜力。
使用方法
MathVista数据集可通过HuggingFace Datasets库进行下载和访问。用户可以通过加载数据集并指定配置名称来获取数据。数据集提供了详细的元数据,包括问题类型、答案格式和图像信息,便于用户进行数据分析和模型评估。
背景与挑战
背景概述
MathVista数据集是由AI4Math团队创建的一个综合性的数学推理基准,专注于视觉上下文中的数学问题。该数据集于2023年发布,主要研究人员包括Lu Pan等人,隶属于多个知名机构,如华盛顿大学和微软研究院。MathVista的核心研究问题是如何在视觉环境中评估和提升基础模型的数学推理能力。它整合了三个新创建的数据集(IQTest、FunctionQA和PaperQA)以及来自文献的9个MathQA数据集和19个VQA数据集,共计6,141个样本,涵盖了广泛的数学和科学领域。这一数据集的推出,极大地丰富了视觉感知和数学推理任务的多样性和复杂性,对推动多模态学习和数学教育领域的研究具有重要意义。
当前挑战
MathVista数据集面临的挑战主要集中在两个方面。首先,构建过程中需要整合和标准化来自31个不同数据集的样本,这要求高度的数据清洗和标注一致性。其次,该数据集旨在解决视觉上下文中的数学推理问题,这涉及到复杂的图像理解和多步骤的逻辑推理,对模型的视觉感知和数学推理能力提出了极高的要求。此外,数据集的多样性和复杂性也增加了模型训练和评估的难度,特别是在处理不同语言和不同学科的数学问题时。这些挑战不仅推动了数据集本身的完善,也为相关领域的研究提供了新的方向和机遇。
常用场景
经典使用场景
MathVista数据集在数学推理与视觉上下文结合的领域中具有经典应用。其主要用于评估模型在处理复杂数学问题时的视觉理解能力,特别是在几何、代数和统计推理等方面。通过提供包含图像和文本的多模态数据,MathVista帮助研究者开发和验证能够结合视觉信息进行精确数学推理的模型。
实际应用
MathVista数据集在实际应用中展现了其广泛潜力。例如,在教育领域,它可以用于开发智能辅导系统,帮助学生通过视觉辅助工具更好地理解和解决数学问题。此外,在科学研究和工程设计中,MathVista可以用于自动化数据分析和报告生成,提高工作效率和准确性。
衍生相关工作
MathVista数据集的发布催生了一系列相关研究工作。例如,研究者们利用该数据集开发了新的多模态学习算法,提升了模型在视觉和文本结合任务中的表现。此外,MathVista还激发了对数学教育中视觉辅助工具的研究,推动了教育技术的创新。这些工作不仅扩展了数据集的应用范围,也为未来的研究提供了丰富的资源和灵感。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录