five

AtomMATH|数学推理数据集|多模态数据数据集

收藏
github2024-11-21 更新2024-11-28 收录
数学推理
多模态数据
下载链接:
https://github.com/Quinn777/AtomThink
下载链接
链接失效反馈
资源简介:
AtomMATH是一个大规模的多模态数据集,用于长链思维(CoT)的数学任务。该数据集旨在解决缺乏高质量视觉数学数据的挑战,并提供了一个原子能力评估指标来评估数学任务的每一步推理。
创建时间:
2024-11-18
原始信息汇总

AtomThink 数据集概述

数据集详情

数据集名称

  • AtomMATH

数据集用途

  • 用于指令微调(AMATH-SFT)和训练策略奖励模型(AMATH-PRM)。

数据集来源

  • 数据集包含多个子数据集,具体如下:
Source Meta Samples AMATH-SFT AMATH-PRM
CLEVR 1929 11.2k 25k
Geometry3K 1201 11.1k 15.6k
MAVIS 3654 17.7k 30.5k
TabMWP 2463 15.7k 25.7k
GeomVerse 1347 9.9k 17k
MathV360K 10157 53.5k 24.8k
MMMU 76 0.6k 1.2k
GeoQA+ 2082 19.5k 0
IconQA 3199 18.1k 0
Total 26108 157k 130k

数据集示例

  • AMATH-SFT 数据集示例:

    • 示例1:AMATH-SFT 示例1
    • 示例2:AMATH-SFT 示例2
  • AMATH-PRM 数据集示例:

    • 示例1:AMATH-PRM 示例1
    • 示例2:AMATH-PRM 示例2
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建AtomMATH数据集时,研究团队采用了多源数据融合的方法,从CLEVR、Geometry3K、MAVIS、TabMWP、GeomVerse、MathV360K、MMMU、GeoQA+和IconQA等多个数据源中提取样本,并进行细致的标注和整合。这些数据源涵盖了不同类型的数学问题,通过精心设计的CoT(Chain of Thought)注释引擎,自动生成高质量的CoT注释,以弥补视觉数学数据的高质量缺失。此外,数据集分为AMATH-SFT和AMATH-PRM两个部分,分别用于指令微调和策略奖励模型的训练,确保数据集在多模态数学任务中的广泛适用性和深度优化。
特点
AtomMATH数据集的显著特点在于其多模态性和高度结构化的数据组织。该数据集不仅包含了丰富的视觉和文本信息,还通过CoT注释引擎生成了详细的推理链,使得模型能够在复杂的数学任务中进行逐步推理。此外,数据集的规模庞大,总样本数超过26000个,且分为AMATH-SFT和AMATH-PRM两个子集,分别用于不同的训练目的。这种精细的划分和高质量的注释使得AtomMATH在多模态数学推理任务中表现出色,显著提升了模型的推理精度和效率。
使用方法
使用AtomMATH数据集时,用户可以根据具体需求选择AMATH-SFT或AMATH-PRM子集进行训练。AMATH-SFT适用于指令微调,旨在提升模型的基本推理能力;而AMATH-PRM则用于策略奖励模型的训练,通过监督语言处理过程,进一步优化模型的推理策略。用户可以通过访问数据集的GitHub页面获取详细的使用指南和代码示例,确保数据集的有效利用。此外,数据集的结构化设计和高质量注释使得其在多种多模态数学推理任务中具有广泛的应用前景,为研究者和开发者提供了强大的工具支持。
背景与挑战
背景概述
AtomMATH数据集是由Kun Xiang等研究人员于2024年创建,旨在解决多模态数学推理任务中的复杂问题。该数据集的核心研究问题是如何通过引入“慢思考”框架,即长链思维(CoT),来提升多模态大语言模型(MLLMs)在数学任务中的表现。AtomMATH不仅为多模态数学推理提供了大规模的数据支持,还通过其独特的CoT注释引擎和原子步骤微调策略,显著提高了模型的推理能力。该数据集的发布对多模态数学推理领域具有重要影响,为后续研究提供了坚实的基础。
当前挑战
AtomMATH数据集在构建过程中面临多项挑战。首先,多模态数学推理任务本身具有高度复杂性,需要模型具备强大的跨模态理解和推理能力。其次,数据集的构建涉及大量高质量的CoT注释生成,这一过程需要精确且耗时。此外,原子步骤微调策略的实施也面临技术难题,如何有效优化MLLM和策略奖励模型(PRM)以实现逐步推理,是一个亟待解决的问题。最后,数据集的规模和多样性要求高,确保覆盖广泛的数学问题类型,以提升模型的泛化能力。
常用场景
经典使用场景
在多模态数学任务领域,AtomMATH数据集的经典使用场景主要体现在其对复杂数学问题的逐步推理能力。通过结合视觉和文本数据,该数据集支持模型进行详细的链式思考(CoT),从而在处理几何、代数等复杂数学问题时展现出卓越的性能。例如,在解决几何问题时,模型能够通过逐步推理,从基本的几何概念出发,逐步推导出最终答案,这一过程类似于人类的慢思考模式,显著提升了推理的准确性和可靠性。
解决学术问题
AtomMATH数据集在学术研究中解决了多模态数学推理中的关键问题,特别是在缺乏高质量视觉数学数据的情况下。通过引入链式思考(CoT)和原子步骤微调策略,该数据集不仅填补了这一领域的数据空白,还显著提升了多模态大语言模型(MLLMs)的推理能力。其提出的原子能力评估指标,为数学任务的质量评估提供了新的标准,推动了相关领域的研究进展。
衍生相关工作
AtomMATH数据集的发布催生了多项相关研究工作,特别是在多模态数学推理和链式思考(CoT)领域。例如,基于该数据集的研究成果,学者们开发了多种新的推理算法和模型,进一步提升了多模态数学任务的解决能力。此外,该数据集还激发了对慢思考框架的深入研究,推动了多模态大语言模型(MLLMs)在复杂任务中的应用和发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

中国区域环境数据库

该数据集包含中国各区域的环境数据,涵盖空气质量、水质、土壤污染等多个方面的指标。数据以时间序列的形式记录,便于进行长期的环境变化分析。

www.mee.gov.cn 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

WeChat Social Network Dataset

该数据集包含了微信社交网络的用户关系数据,包括用户之间的关注关系、互动行为等。数据集旨在帮助研究社交网络的结构和动态变化。

www.aminer.cn 收录