fblgit/simple-math
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fblgit/simple-math
下载链接
链接失效反馈官方服务:
资源简介:
Simple Math数据集是一个用于训练模型进行基本数学运算的数据集。它包含多个分割,如arithmetic.float2_train、arithmetic.float2_valid等,每个分割都有相应的字节大小和示例数量。数据集的特征包括output和instruction,数据类型均为字符串。数据集的任务类别包括文本生成和问答,标签为数学和金融。数据集的许可证为cc-by-nc-nd-4.0,大小类别为100K<n<1M。数据集的创建目的是为了在模型训练中加入基本的数学运算,代码版本为20240127.fblgit。README还提供了数据集的评估结果、贡献者的注意事项和引用信息。
Simple Math数据集是一个用于训练模型进行基本数学运算的数据集。它包含多个分割,如arithmetic.float2_train、arithmetic.float2_valid等,每个分割都有相应的字节大小和示例数量。数据集的特征包括output和instruction,数据类型均为字符串。数据集的任务类别包括文本生成和问答,标签为数学和金融。数据集的许可证为cc-by-nc-nd-4.0,大小类别为100K<n<1M。数据集的创建目的是为了在模型训练中加入基本的数学运算,代码版本为20240127.fblgit。README还提供了数据集的评估结果、贡献者的注意事项和引用信息。
提供机构:
fblgit
原始信息汇总
数据集概述
数据集信息
特征
- output: 数据类型为字符串(string)
- instruction: 数据类型为字符串(string)
数据划分
- arithmetic.float2_train: 字节数为645500.3,样本数为19000
- arithmetic.float2_valid: 字节数为33973.7,样本数为1000
- arithmetic.float3_train: 字节数为1890863.85,样本数为47500
- arithmetic.float3_valid: 字节数为99519.15,样本数为2500
- arithmetic.float34_train: 字节数为9321513.05,样本数为218500
- arithmetic.float34_valid: 字节数为490605.95,样本数为11500
- arithmetic.float4_train: 字节数为21671996.6,样本数为475000
- arithmetic.float4_valid: 字节数为1140631.4,样本数为25000
数据集大小
- 下载大小: 27928049字节
- 数据集大小: 35294604字节
配置
- config_name: default
- 数据文件:
- train: data/train-*
- test: data/test-*
- 数据文件:
标签
- math
- finance
许可
- cc-by-nc-nd-4.0
任务类别
- text-generation
- question-answering
数据集名称
- Simple Math
数据集规模
- 100K<n<1M



