Azure99/blossom-math-v4

Name: Azure99/blossom-math-v4
Creator: Azure99
Published: 2024-03-07 15:20:29
License: 暂无描述

Hugging Face2024-03-07 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/Azure99/blossom-math-v4

下载链接

链接失效反馈

官方服务：

资源简介：

Blossom Math V4是基于Math23K和GSM8K衍生而来的中英双语数学对话数据集，适用于数学问题微调。相比于blossom-math-v3，本版本完全使用GPT-4进行蒸馏，大幅提升了推理的一致性。本数据集采用全量Math23K、GSM8K和翻译后的GSM8K的问题，随后调用gpt-4-0125-preview生成结果，并使用原始数据集中的答案对生成的结果进行验证，过滤掉错误答案，很大程度上保证了问题和答案的准确性。本次发布了全量数据的25%，包含10K记录。

Blossom Math V4 is a bilingual (Chinese and English) mathematical dialogue dataset derived from Math23K and GSM8K, suitable for fine-tuning mathematical problems. This dataset uses GPT-4 for distillation, significantly improving the consistency of reasoning. It includes all questions from Math23K, GSM8K, and translated GSM8K, with results generated by gpt-4-0125-preview, and verified and filtered using answers from the original datasets to ensure the accuracy of questions and answers. The dataset structure includes fields such as id, input, output, answer, and dataset, representing the question id, problem, generated answer, correct answer, and original dataset, respectively. 25% of the full dataset, containing 10K records, has been released.

提供机构：

Azure99

原始信息汇总

BLOSSOM MATH V4 数据集概述

介绍

Blossom Math V4 是一个基于 Math23K 和 GSM8K 衍生而来的中英双语数学对话数据集，适用于数学问题微调。该数据集完全使用 GPT-4 进行蒸馏，显著提升了推理的一致性。数据集包含全量 Math23K、GSM8K 和翻译后的 GSM8K 的问题，通过调用 gpt-4-0125-preview 生成结果，并使用原始数据集中的答案进行验证，过滤掉错误答案，从而保证问题和答案的准确性。本次发布的数据包含 10K 记录，占全量数据的 25%。

语言

数据集支持中文和英文。

数据集结构

每条数据包含以下字段：

id：字符串，代表原始数据集中的题目id，与dataset字段结合可确定唯一题目。
input：字符串，代表问题。
output：字符串，代表gpt-4-0125-preview生成的答案。
answer：字符串，代表正确答案。
dataset：字符串，代表原始数据集。

数据集限制

数据集的所有响应均由 gpt-4-0125-preview 生成，并经过初步校验，但仍可能包含不准确的回答。

搜集汇总

数据集介绍

构建方式

在数学问题求解领域，高质量的双语数据集对于提升模型推理能力至关重要。Blossom Math V4的构建过程体现了严谨的数据蒸馏策略，其基础源于Math23K和GSM8K两大经典数学问题集，并整合了翻译后的GSM8K内容。通过调用GPT-4模型生成初步答案，并利用原始数据集的正确答案进行验证与过滤，有效剔除了错误响应，从而在较大程度上保障了问题与答案的准确性。该版本完全依托GPT-4进行知识蒸馏，显著增强了推理过程的一致性，目前公开的数据约占全量的四分之一，包含约一万条记录。

使用方法

在应用层面，该数据集主要面向文本生成与文本到文本生成任务，适用于对预训练语言模型进行数学问题求解的微调。使用者可依据数据集中的input字段作为模型输入，output字段作为训练目标或参考，answer字段则用于验证模型输出的正确性。通过结合dataset字段，研究者能够追溯问题来源，进行跨数据集的对比分析，从而深入探索模型在不同数学问题类型上的表现与泛化能力。

背景与挑战

背景概述

在人工智能与自然语言处理领域，数学推理能力的构建一直是核心研究议题之一。Azure99/blossom-math-v4数据集于近期发布，由研究团队基于Math23K和GSM8K等经典数学问题集衍生构建，专注于中英双语数学对话任务的微调需求。该数据集通过GPT-4模型进行知识蒸馏，显著提升了推理过程的一致性，其创建旨在为数学问题求解、对话系统及大语言模型的逻辑推理能力提供高质量的训练资源。这一工作不仅延续了数学问题数据集的发展脉络，也为多语言环境下的教育技术应用注入了新的活力。

当前挑战

该数据集致力于应对数学问题求解中的复杂推理挑战，尤其是在多语言语境下准确理解问题并生成连贯、正确的解答。构建过程中的主要挑战包括：确保由GPT-4生成的答案与原始数据集标准答案之间的一致性，这需要通过严格的验证流程过滤错误响应；同时，处理中英双语数据的对齐与质量把控也是一项艰巨任务，需在保持语言多样性的基础上维持逻辑的精确性。此外，数据规模的扩展与错误样本的剔除进一步增加了构建的复杂性。

常用场景

经典使用场景

在数学教育技术领域，Blossom Math V4数据集常被用于微调大型语言模型，以提升其解决中英双语数学问题的能力。该数据集整合了Math23K和GSM8K的优质题目，通过GPT-4蒸馏生成高质量的推理过程，为模型训练提供了丰富的对话式数学问题范例。研究人员利用这些数据优化模型的逻辑推理和分步解答能力，使其在数学对话任务中表现出更强的准确性和一致性。

解决学术问题

该数据集有效应对了数学问题求解中模型推理一致性与多语言适配的学术挑战。通过提供经过验证的中英双语数学对话数据，它助力研究者探索语言模型在复杂数学逻辑下的泛化性能，减少了传统方法中因数据噪声或语言壁垒导致的误差。这一资源为数学自动问答、推理可解释性等研究方向提供了坚实的数据基础，推动了教育人工智能领域的理论进展。

实际应用

在实际应用中，Blossom Math V4数据集能够支撑智能辅导系统的开发，为学生提供个性化的数学解题辅助。教育科技公司可基于此数据集训练对话代理，实现实时的问题解答与步骤引导，增强在线学习平台的互动性。同时，它也可用于评估各类语言模型在数学领域的性能，为产品优化提供基准参考，促进人工智能技术在教育场景中的落地与普及。

数据集最近研究