DataMuncher-Labs/LSReasoning-1250000
收藏Hugging Face2025-12-29 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/DataMuncher-Labs/LSReasoning-1250000
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
tags:
- math
- algebra
- reasoning
- equations
- fractions
- word-problems
- logic
- llm-training
- finetuning
- Math
- Algebra
- Reasoning
- Equations
- Fractions
- Equations
- Logic
- Finetuning
pretty_name: LSReasoning-1250000
size_categories:
- 1M<n<10M
license: mit
---
# Large-Scale Mathematic Reasoning-1250000
# Built via a python script
## Contents
- Addition
- Subtraction
- Multiplication
- Division
- Linear equations
- Fractional equations
- Two step equations
- Algebra word problems
Synthetic algebra-heavy math reasoning dataset.
Each row:
- question
- problem
- how_to_solve
- answer
## Useage
Licensed under MIT
Free to use for everyone
##Notes
It is
- Better to use smaller variants of this dataset for finetuning
- Better to use very small variants of this dataset for evaluation
- Better to use large variants of this dataset for pre-training
语言:
- 英语
标签:
- 数学
- 代数
- 推理
- 方程
- 分数
- 文字应用题
- 逻辑
- 大语言模型训练(LLM Training)
- 微调(Finetuning)
- 数学
- 代数
- 推理
- 方程
- 分数
- 方程
- 逻辑
- 微调
展示名称:LSReasoning-1250000
规模类别:
- 100万<样本数量<1000万
许可证:MIT协议
# 大规模数学推理-1250000
## 构建方式:通过Python脚本生成
## 数据集内容
- 加法运算
- 减法运算
- 乘法运算
- 除法运算
- 线性方程
- 分式方程
- 两步方程
- 代数文字应用题
本数据集为侧重代数的合成式数学推理数据集。
每条样本包含以下字段:
- 问题(question)
- 题干(problem)
- 解题步骤(how_to_solve)
- 答案(answer)
## 使用说明
本数据集采用MIT许可证授权
可免费面向所有用户使用
## 注意事项
本数据集使用建议如下:
- 建议使用该数据集的小体量变体进行模型微调(Finetuning)
- 建议使用该数据集的超小体量变体进行模型评估
- 建议使用该数据集的大体量变体进行模型预训练
提供机构:
DataMuncher-Labs



