loubnabnl/textbooks-filtering-600-samples

Name: loubnabnl/textbooks-filtering-600-samples
Creator: loubnabnl
Published: 2023-08-22 22:18:37
License: 暂无描述

Hugging Face2023-08-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/loubnabnl/textbooks-filtering-600-samples

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: llama_70b_sample_prompt0 path: data/llama_70b_sample_prompt0-* - split: llama_70b_greedy path: data/llama_70b_greedy-* - split: llama_70b_greedy_discrete path: data/llama_70b_greedy_discrete-* - split: llama_70b_greedy_no_conf path: data/llama_70b_greedy_no_conf-* - split: llama_70b_greedy_no_conf_noprefix path: data/llama_70b_greedy_no_conf_noprefix-* - split: llama_70b_meta path: data/llama_70b_meta-* - split: llama_70b_nometa path: data/llama_70b_nometa-* - split: llama_70b_meta_v2 path: data/llama_70b_meta_v2-* - split: chatgpt path: data/chatgpt-* - split: gpt4 path: data/gpt4-* dataset_info: features: - name: completion dtype: string - name: eval_prompt_header dtype: string - name: generation_config struct: - name: temperature dtype: float64 - name: top_p dtype: float64 - name: prompt dtype: string - name: review_model dtype: string - name: score dtype: float64 splits: - name: llama_70b_sample_prompt0 num_bytes: 2756529 num_examples: 600 - name: llama_70b_greedy num_bytes: 3139908 num_examples: 600 - name: llama_70b_greedy_discrete num_bytes: 3138291 num_examples: 600 - name: llama_70b_greedy_no_conf num_bytes: 3359124 num_examples: 600 - name: llama_70b_greedy_no_conf_noprefix num_bytes: 3461124 num_examples: 600 - name: llama_70b_meta num_bytes: 3085159 num_examples: 600 - name: llama_70b_nometa num_bytes: 3068954 num_examples: 600 - name: llama_70b_meta_v2 num_bytes: 3327190 num_examples: 600 - name: chatgpt num_bytes: 2772298 num_examples: 600 - name: gpt4 num_bytes: 2800099 num_examples: 600 download_size: 1748097 dataset_size: 30908676 --- # Dataset Card for "textbooks-filtering-600-samples" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

loubnabnl

原始信息汇总

数据集概述

配置信息

默认配置：
- 数据文件：
  - llama_70b_sample_prompt0：路径为 data/llama_70b_sample_prompt0-*
  - llama_70b_greedy：路径为 data/llama_70b_greedy-*
  - llama_70b_greedy_discrete：路径为 data/llama_70b_greedy_discrete-*
  - llama_70b_greedy_no_conf：路径为 data/llama_70b_greedy_no_conf-*
  - llama_70b_greedy_no_conf_noprefix：路径为 data/llama_70b_greedy_no_conf_noprefix-*
  - llama_70b_meta：路径为 data/llama_70b_meta-*
  - llama_70b_nometa：路径为 data/llama_70b_nometa-*
  - llama_70b_meta_v2：路径为 data/llama_70b_meta_v2-*
  - chatgpt：路径为 data/chatgpt-*
  - gpt4：路径为 data/gpt4-*

数据集信息

特征：
- completion：类型为 string
- eval_prompt_header：类型为 string
- generation_config：结构包含：
  - temperature：类型为 float64
  - top_p：类型为 float64
- prompt：类型为 string
- review_model：类型为 string
- score：类型为 float64
分割：
- llama_70b_sample_prompt0：字节数为 2756529，样本数为 600
- llama_70b_greedy：字节数为 3139908，样本数为 600
- llama_70b_greedy_discrete：字节数为 3138291，样本数为 600
- llama_70b_greedy_no_conf：字节数为 3359124，样本数为 600
- llama_70b_greedy_no_conf_noprefix：字节数为 3461124，样本数为 600
- llama_70b_meta：字节数为 3085159，样本数为 600
- llama_70b_nometa：字节数为 3068954，样本数为 600
- llama_70b_meta_v2：字节数为 3327190，样本数为 600
- chatgpt：字节数为 2772298，样本数为 600
- gpt4：字节数为 2800099，样本数为 600
下载大小：1748097 字节
数据集大小：30908676 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集