five

DataMuncher-Labs/LSReasoning-1250000

收藏
Hugging Face2025-12-29 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/DataMuncher-Labs/LSReasoning-1250000
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en tags: - math - algebra - reasoning - equations - fractions - word-problems - logic - llm-training - finetuning - Math - Algebra - Reasoning - Equations - Fractions - Equations - Logic - Finetuning pretty_name: LSReasoning-1250000 size_categories: - 1M<n<10M license: mit --- # Large-Scale Mathematic Reasoning-1250000 # Built via a python script ## Contents - Addition - Subtraction - Multiplication - Division - Linear equations - Fractional equations - Two step equations - Algebra word problems Synthetic algebra-heavy math reasoning dataset. Each row: - question - problem - how_to_solve - answer ## Useage Licensed under MIT Free to use for everyone ##Notes It is - Better to use smaller variants of this dataset for finetuning - Better to use very small variants of this dataset for evaluation - Better to use large variants of this dataset for pre-training

语言: - 英语 标签: - 数学 - 代数 - 推理 - 方程 - 分数 - 文字应用题 - 逻辑 - 大语言模型训练(LLM Training) - 微调(Finetuning) - 数学 - 代数 - 推理 - 方程 - 分数 - 方程 - 逻辑 - 微调 展示名称:LSReasoning-1250000 规模类别: - 100万<样本数量<1000万 许可证:MIT协议 # 大规模数学推理-1250000 ## 构建方式:通过Python脚本生成 ## 数据集内容 - 加法运算 - 减法运算 - 乘法运算 - 除法运算 - 线性方程 - 分式方程 - 两步方程 - 代数文字应用题 本数据集为侧重代数的合成式数学推理数据集。 每条样本包含以下字段: - 问题(question) - 题干(problem) - 解题步骤(how_to_solve) - 答案(answer) ## 使用说明 本数据集采用MIT许可证授权 可免费面向所有用户使用 ## 注意事项 本数据集使用建议如下: - 建议使用该数据集的小体量变体进行模型微调(Finetuning) - 建议使用该数据集的超小体量变体进行模型评估 - 建议使用该数据集的大体量变体进行模型预训练
提供机构:
DataMuncher-Labs
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作