five

Asap7772/Flatten-Math-Shepherd

收藏
Hugging Face2024-04-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Asap7772/Flatten-Math-Shepherd
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: prompt dtype: string - name: response dtype: string - name: next_prompt dtype: string - name: next_response dtype: string - name: label dtype: string - name: dense_reward dtype: int64 - name: sparse_reward dtype: int64 - name: rewards_to_go sequence: int64 - name: rewards_to_go_sparse sequence: int64 - name: masks_to_go sequence: int64 - name: question dtype: string - name: step dtype: int64 - name: trajectory dtype: int64 - name: mask dtype: int64 splits: - name: train num_bytes: 4637472532.430903 num_examples: 2486426 - name: test num_bytes: 521631869.56909645 num_examples: 279678 download_size: 890365116 dataset_size: 5159104402.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---
提供机构:
Asap7772
原始信息汇总

数据集概述

数据集特征

  • prompt: 数据类型为字符串
  • response: 数据类型为字符串
  • next_prompt: 数据类型为字符串
  • next_response: 数据类型为字符串
  • label: 数据类型为字符串
  • dense_reward: 数据类型为整数(int64)
  • sparse_reward: 数据类型为整数(int64)
  • rewards_to_go: 数据类型为序列整数(sequence: int64)
  • rewards_to_go_sparse: 数据类型为序列整数(sequence: int64)
  • masks_to_go: 数据类型为序列整数(sequence: int64)
  • question: 数据类型为字符串
  • step: 数据类型为整数(int64)
  • trajectory: 数据类型为整数(int64)
  • mask: 数据类型为整数(int64)

数据集分割

  • 训练集(train): 包含2486426个样本,总大小为4637472532.430903字节
  • 测试集(test): 包含279678个样本,总大小为521631869.56909645字节

数据集大小

  • 下载大小: 890365116字节
  • 数据集总大小: 5159104402.0字节

配置文件

  • 默认配置(default):
    • 训练数据路径: data/train-*
    • 测试数据路径: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作