five

fblgit/simple-math

收藏
Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fblgit/simple-math
下载链接
链接失效反馈
官方服务:
资源简介:
Simple Math数据集是一个用于训练模型进行基本数学运算的数据集。它包含多个分割,如arithmetic.float2_train、arithmetic.float2_valid等,每个分割都有相应的字节大小和示例数量。数据集的特征包括output和instruction,数据类型均为字符串。数据集的任务类别包括文本生成和问答,标签为数学和金融。数据集的许可证为cc-by-nc-nd-4.0,大小类别为100K<n<1M。数据集的创建目的是为了在模型训练中加入基本的数学运算,代码版本为20240127.fblgit。README还提供了数据集的评估结果、贡献者的注意事项和引用信息。

Simple Math数据集是一个用于训练模型进行基本数学运算的数据集。它包含多个分割,如arithmetic.float2_train、arithmetic.float2_valid等,每个分割都有相应的字节大小和示例数量。数据集的特征包括output和instruction,数据类型均为字符串。数据集的任务类别包括文本生成和问答,标签为数学和金融。数据集的许可证为cc-by-nc-nd-4.0,大小类别为100K<n<1M。数据集的创建目的是为了在模型训练中加入基本的数学运算,代码版本为20240127.fblgit。README还提供了数据集的评估结果、贡献者的注意事项和引用信息。
提供机构:
fblgit
原始信息汇总

数据集概述

数据集信息

特征

  • output: 数据类型为字符串(string)
  • instruction: 数据类型为字符串(string)

数据划分

  • arithmetic.float2_train: 字节数为645500.3,样本数为19000
  • arithmetic.float2_valid: 字节数为33973.7,样本数为1000
  • arithmetic.float3_train: 字节数为1890863.85,样本数为47500
  • arithmetic.float3_valid: 字节数为99519.15,样本数为2500
  • arithmetic.float34_train: 字节数为9321513.05,样本数为218500
  • arithmetic.float34_valid: 字节数为490605.95,样本数为11500
  • arithmetic.float4_train: 字节数为21671996.6,样本数为475000
  • arithmetic.float4_valid: 字节数为1140631.4,样本数为25000

数据集大小

  • 下载大小: 27928049字节
  • 数据集大小: 35294604字节

配置

  • config_name: default
    • 数据文件:
      • train: data/train-*
      • test: data/test-*

标签

  • math
  • finance

许可

  • cc-by-nc-nd-4.0

任务类别

  • text-generation
  • question-answering

数据集名称

  • Simple Math

数据集规模

  • 100K<n<1M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作