NATURALREASONING

Name: NATURALREASONING
Creator: Meta, New York University
Published: 2025-02-19 02:46:57
License: 暂无描述

arXiv2025-02-19 更新2025-02-27 收录

下载链接：

http://arxiv.org/abs/2502.13124v1

下载链接

链接失效反馈

官方服务：

资源简介：

NATURALREASONING是一个包含280万个问题的综合数据集，由Meta和纽约大学的研究人员创建。该数据集覆盖了多个领域，包括STEM领域（如物理、计算机科学）、经济学、社会科学等，旨在解决自然语言处理模型在推理能力方面的挑战。数据集中的问题是从预训练语料库中合成的，包含了各种难度和类型的问题，能够促进LLM模型推理能力的提升。

NATURALREASONING is a comprehensive dataset containing 2.8 million questions, created by researchers at Meta and New York University. Spanning multiple domains including STEM disciplines such as physics and computer science, economics, and social sciences, it aims to address the challenges faced by natural language processing models in terms of their reasoning capabilities. The questions in the dataset are synthesized from pre-trained corpora, covering various difficulty levels and question types, which can promote the improvement of the reasoning abilities of LLM models.

提供机构：

Meta, New York University

创建时间：

2025-02-19

搜集汇总

数据集介绍

构建方式

NATURALREASONING数据集的构建采用了预训练语料库中的文档，通过大型语言模型（LLM）进行标注和合成，以生成包含推理内容的文档。对于具有高推理水平的文档，LLM被用来合成独立且具有挑战性的推理问题。同时，LLM还被用来验证是否可以从文档中导出正确答案，并将其作为参考答案。此外，每个问题还附加了一个由相对较强的开源模型Llama3.3-70B-Instruct生成的回答。

特点

NATURALREASONING数据集具有以下特点：首先，问题是从预训练语料库中反向翻译的，确保了数据集代表真实世界的推理问题；其次，问题既包含可验证的答案，也包含开放式答案，如定理证明，为开发学习算法提供了丰富的资源；最后，数据集的问题需要比现有数据集更高级的推理，有助于提高LLMs的推理能力。

使用方法

NATURALREASONING数据集的使用方法包括：1. 知识蒸馏：使用NATURALREASONING中的问题进行知识蒸馏，可以有效提升LLMs的推理能力；2. 自训练：使用模型自身的回答进行自训练，例如通过外部奖励模型或自奖励技术进行自训练。

背景与挑战

背景概述

NATURALREASONING数据集由Meta和纽约大学的研究人员于2025年创建，旨在解决现有推理数据集在多样性和难度上的不足。该数据集包含280万个涵盖多个领域的推理问题，包括STEM领域（如物理、计算机科学）、经济学、社会科学等。NATURALREASONING的独特之处在于，它使用预训练语料库中的问题进行反向翻译，确保问题代表现实世界的推理问题，并包含可验证和开放式的答案，为发展学习算法以提高LLMs的推理能力提供了丰富的资源。此外，NATURALREASONING中的问题需要比现有数据集中的问题更高级的推理，因此可以通过从更强的教师模型到较弱的学生模型的知识的蒸馏或基于外部奖励模型或自我奖励技术（Yuan et al., 2024a）的自主学习来提高LLMs的推理能力。

当前挑战

NATURALREASONING数据集面临的挑战包括：1) 所解决的领域问题的挑战：该数据集旨在解决推理数据集中缺乏多样性和高难度的问题，尤其是开放式的推理问题。2) 构建过程中的挑战：数据集的构建过程依赖于LLMs的标注和合成，需要确保LLMs能够准确理解和生成高质量的推理问题，并避免重复和污染问题。

常用场景

经典使用场景

NATURALREASONING数据集广泛应用于提升大型语言模型（LLMs）的推理能力。该数据集包含2.8百万个涵盖多个领域的推理问题，如STEM领域（物理学、计算机科学）、经济学、社会科学等。其经典使用场景包括知识蒸馏实验，通过从强教师模型中提取和转移推理能力，从而提升LLMs的推理能力。此外，NATURALREASONING也适用于无监督自训练，使用外部奖励模型或自奖励机制，从而提升LLMs的推理能力。

衍生相关工作

NATURALREASONING数据集衍生了多项相关工作，如Self-Instruct、STaR和Metamath等。这些工作都旨在通过使用LLMs生成新的数据集，从而提升LLMs的推理能力。此外，NATURALREASONING数据集还衍生了多项无监督自训练方法，如RFT和DPO等，这些方法可以有效地提升LLMs的推理能力。

数据集最近研究