gsm8k-synthetic-diverse-405b
收藏Hugging Face2024-09-06 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/gretelai/gsm8k-synthetic-diverse-405b
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成生成的版本,灵感来源于GSM8K数据集,完全使用Gretel Navigator和meta-llama/Meta-Llama-3.1-405B作为代理LLM创建。它包含约1500个小学级别的数学应用题,具有逐步解决方案,专注于年龄组、难度和领域的多样性。数据集的特点包括:使用Gretel Navigator合成的数学问题,采用进化技术、LLM-as-a-judge和通过sympy库验证的注释计算;按主题和难度分层的测试集;多样化的现实世界背景和名称;每个问题都标有适当的年龄组(2至6年级);问题分为简单、中等或困难;涵盖广泛的主题,包括基础代数、几何等;逐步解决方案,带有注释的算术操作。
提供机构:
Gretel.ai
创建时间:
2024-09-06
搜集汇总
数据集介绍

构建方式
gsm8k-synthetic-diverse-405b数据集是基于GSM8K数据集,通过Gretel Navigator平台使用meta-llama/Meta-Llama-3.1-405B大语言模型生成的全新合成数据集。该数据集包含了约1500道小学级别的数学应用题,每道题目均配有详细的逐步解答。数据生成过程中采用了进化算法、LLM-as-a-judge技术,并通过sympy库对标注的计算过程进行了验证,确保了题目的多样性和准确性。
特点
该数据集的特点在于其丰富的多样性和细致的标注。题目涵盖了从代数、几何到概率等多个数学领域,并根据难度分为简单、中等、困难和非常困难四个等级。每道题目均标注了适合的年级(2至6年级),并融入了多样化的现实场景和多元文化背景的姓名。此外,数据集还提供了分层测试集,包含300个测试样本,其余用于训练,确保了数据在主题和难度上的均衡分布。
使用方法
该数据集适用于数学应用题生成、教育技术开发以及大语言模型在数学推理任务中的性能评估。用户可以通过Hugging Face平台直接访问数据集,并利用其提供的分层测试集进行模型训练和验证。数据集中的逐步解答可用于指导模型生成详细的推理过程,提升模型在复杂数学问题上的表现。引用时请遵循提供的引用格式,以确保对数据集的正确使用和学术贡献的认可。
背景与挑战
背景概述
gsm8k-synthetic-diverse-405b数据集是由Gretel AI于2024年9月发布的一个合成生成的数据集,灵感来源于OpenAI的GSM8K数据集。该数据集专注于小学阶段的数学应用题,涵盖了从二年级到六年级的年龄组,并包含逐步解答的详细步骤。数据集通过Gretel Navigator工具生成,使用了meta-llama/Meta-Llama-3.1-405B作为生成模型,结合进化算法和LLM-as-a-judge技术,确保了问题的多样性和准确性。数据集的核心研究问题在于如何通过合成生成技术提升数学问题的多样性和复杂性,从而为教育领域和自然语言处理领域提供更丰富的训练资源。该数据集在教育技术、自动问答系统等领域具有重要的应用潜力。
当前挑战
gsm8k-synthetic-diverse-405b数据集在构建过程中面临多重挑战。首先,生成具有多样性和真实性的数学问题需要平衡问题的难度、年龄组和主题分布,确保问题既符合教育标准又具有足够的挑战性。其次,尽管使用了先进的LLM模型和验证工具(如sympy库),生成的问题仍可能存在逻辑错误或计算偏差,这需要通过严格的验证机制来确保数据的准确性。此外,数据集的多样性要求涵盖广泛的现实场景和多元文化背景,这对生成模型的上下文理解和表达能力提出了更高的要求。最后,如何将生成的数据集有效地应用于实际教育场景或问答系统,仍需进一步的研究和优化。
常用场景
经典使用场景
gsm8k-synthetic-diverse-405b数据集在自然语言处理领域中被广泛应用于数学问题的自动求解任务。该数据集通过生成具有多样性的小学数学应用题,为模型提供了丰富的训练样本,使其能够在解决复杂数学问题时表现出色。特别是在闭域问答系统中,该数据集能够帮助模型理解并逐步解决涉及代数、几何、概率等多个领域的数学问题。
衍生相关工作
基于gsm8k-synthetic-diverse-405b数据集,研究者们开发了多种先进的数学问题求解模型。例如,一些工作利用该数据集训练了基于Transformer的模型,显著提升了模型在复杂数学问题上的表现。此外,该数据集还启发了多模态学习的研究,结合文本和符号计算技术,进一步提高了数学问题求解的准确性和鲁棒性。
数据集最近研究
最新研究方向
在数学教育领域,gsm8k-synthetic-diverse-405b数据集以其独特的合成生成方式,为小学阶段的数学问题解决研究提供了新的视角。该数据集通过Gretel Navigator和meta-llama/Meta-Llama-3.1-405B模型生成,不仅涵盖了广泛的数学主题,如代数、几何和概率等,还特别强调了问题的多样性和难度分层。这种多样性和分层设计使得该数据集在研究数学问题解决的认知过程、教育技术的有效性评估以及个性化学习路径的设计中具有重要应用价值。此外,数据集中的逐步解决方案和详细的算术操作注释,为开发更智能的教育辅助工具和自动化评分系统提供了丰富的数据支持。
以上内容由遇见数据集搜集并总结生成



