five

codegenning/orm_dataset_raw50_dedup

收藏
Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/codegenning/orm_dataset_raw50_dedup
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: content dtype: string - name: score dtype: int64 - name: solution dtype: string - name: output dtype: string - name: question dtype: string - name: starter_code dtype: string splits: - name: train num_bytes: 307057863 num_examples: 54293 download_size: 137047556 dataset_size: 307057863 configs: - config_name: default data_files: - split: train path: data/train-* ---

The dataset includes multiple features such as content, score, solution, output, question, and starter code, each with its data type. The dataset is divided into a training set, containing 54293 samples and 307057863 bytes of data. The download size of the dataset is 137047556 bytes, and the total size is 307057863 bytes. The dataset configuration is set to default, with training data files located at data/train-* path.
提供机构:
codegenning
原始信息汇总

数据集概述

数据集特征

  • content:数据类型为字符串(string)。
  • score:数据类型为整数(int64)。
  • solution:数据类型为字符串(string)。
  • output:数据类型为字符串(string)。
  • question:数据类型为字符串(string)。
  • starter_code:数据类型为字符串(string)。

数据集划分

  • train:包含54293个样本,总大小为307057863字节。

数据集大小

  • 下载大小:137047556字节。
  • 数据集总大小:307057863字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作