math_distill
收藏MATH Distill 数据集概述
数据集基本信息
- 数据集名称: MATH Distill
- 许可证: Apache 2.0
- 任务类别: 文本生成、问答
- 语言: 英语
- 数据集地址: https://huggingface.co/datasets/rasbt/math_distill
数据集构成
该数据集包含由 DeepSeek R1 和 Qwen3-235B-A22B 为数学问题生成的蒸馏数据。
数据来源
- MATH-500 数据集: 包含 500 个数学问题。
- MATH 数据集: 包含 12,000 个数学问题,与 MATH-500 不重叠。
配置与文件
数据集包含以下配置,每个配置对应一个数据文件:
math500: 对应文件data/deepseek-r1-math500.jsonqwen3_235b_a22b_math500: 对应文件data/qwen3-235B-A22B-math500.jsonmath_train: 对应文件data/deepseek-r1-math-train.jsonmath_train_4000: 对应文件data/deepseek-r1-math-train_4000.jsonqwen3_235b_a22b_math_train: 对应文件data/qwen3-235b-a22b-math-train.json
数据字段
每个数据样本包含以下字段:
problem: 数学问题描述gtruth_answer: 简短的标准答案message_thinking: 大语言模型生成的思维链message_content: 大语言模型生成的最终答案
message_thinking 和 message_content 字段可以组合成完整答案,格式示例如下:
<think>I need to find the largest number of...</think>
The function is continuous...
数据集统计信息
data/deepseek-r1-math500.json
- 记录数: 500
- DeepSeek R1 答案准确率: 91.2% (456/500)
- 字段平均令牌数:
gtruth_answer: 12.27message_content: 333.79message_thinking: 2304.87problem: 78.94
data/qwen3-235B-A22B-math500.json
- 记录数: 500
- Qwen3-235B-A22B 答案准确率: 92.4% (462/500)
- 字段平均令牌数:
gtruth_answer: 12.27message_content: 611.07message_thinking: 4662.99problem: 78.94
data/deepseek-r1-math-train.json
- 记录数: 12000
- DeepSeek R1 答案准确率: 90.6% (10871/12000)
- 字段平均令牌数:
gtruth_answer: 12.49message_content: 350.20message_thinking: 2495.82problem: 80.80
data/deepseek-r1-math-train_4000.json
- 记录数: 9550
- DeepSeek R1 答案准确率: 93.0% (8878/9550)
- 字段平均令牌数:
gtruth_answer: 12.39message_content: 292.00message_thinking: 1303.78problem: 67.00
data/qwen3-235b-a22b-math-train.json
- 记录数: 12000
- Qwen3-235B-A22B 答案准确率: 90.8% (10898/12000)
- 字段平均令牌数:
gtruth_answer: 12.49message_content: 571.53message_thinking: 3130.71problem: 80.80
预期用途
该数据集旨在用于教育目的,训练大语言模型(例如从 DeepSeek R1 或 Qwen3-235B-A22B 进行知识蒸馏)。
使用方式
可以使用 datasets 库加载数据集,示例如下:
python
from datasets import load_dataset
repo_id = "rasbt/math_distill" train = load_dataset(repo_id, "math_train", split="train") math500 = load_dataset(repo_id, "math500", split="train") qwen3_math500 = load_dataset(repo_id, "qwen3_235b_a22b_math500", split="train") train_4000 = load_dataset(repo_id, "math_train_4000", split="train") qwen3_train = load_dataset(repo_id, "qwen3_235b_a22b_math_train", split="train")
引用
如果使用此数据集,请引用原始数据源:
- HuggingFaceH4/MATH-500: https://huggingface.co/datasets/HuggingFaceH4/MATH-500
- qwedsacf/competition_math: https://huggingface.co/datasets/qwedsacf/competition_math




