Mitsuki-Sakamoto/alpaca_farm-RM-Mistral-7B-re-preference-256-nsample-2
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Mitsuki-Sakamoto/alpaca_farm-RM-Mistral-7B-re-preference-256-nsample-2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: preference
dtype: int64
- name: output_1
dtype: string
- name: output_2
dtype: string
- name: reward_model_prompt_format
dtype: string
- name: gen_prompt_format
dtype: string
- name: gen_kwargs
struct:
- name: do_sample
dtype: bool
- name: max_new_tokens
dtype: int64
- name: pad_token_id
dtype: int64
- name: top_k
dtype: int64
- name: top_p
dtype: float64
- name: reward_1
dtype: float64
- name: reward_2
dtype: float64
- name: n_samples
dtype: int64
- name: reject_select
dtype: string
splits:
- name: preference
num_bytes: 58969064
num_examples: 20001
download_size: 26765193
dataset_size: 58969064
configs:
- config_name: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
data_files:
- split: preference
path: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500/preference-*
---
数据集信息:
配置名称:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
特征:
- 名称:指令(instruction),数据类型:字符串
- 名称:输入(input),数据类型:字符串
- 名称:输出(output),数据类型:字符串
- 名称:偏好(preference),数据类型:64位整数(int64)
- 名称:输出1(output_1),数据类型:字符串
- 名称:输出2(output_2),数据类型:字符串
- 名称:奖励模型提示格式(reward_model_prompt_format),数据类型:字符串
- 名称:生成提示格式(gen_prompt_format),数据类型:字符串
- 名称:生成参数字典(gen_kwargs),结构化数据:
- 名称:是否采样(do_sample),数据类型:布尔值(bool)
- 名称:最大新生成Token数(max_new_tokens),数据类型:64位整数(int64)
- 名称:填充Token ID(pad_token_id),数据类型:64位整数(int64)
- 名称:Top-K采样(top_k),数据类型:64位整数(int64)
- 名称:Top-P采样(top_p),数据类型:64位双精度浮点数(float64)
- 名称:奖励值1(reward_1),数据类型:64位双精度浮点数(float64)
- 名称:奖励值2(reward_2),数据类型:64位双精度浮点数(float64)
- 名称:样本数量(n_samples),数据类型:64位整数(int64)
- 名称:拒绝选择(reject_select),数据类型:字符串
划分集:
- 名称:偏好划分集(preference),字节数:58969064,样本数量:20001
下载大小:26765193
数据集占用大小:58969064
配置项:
- 配置名称:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
数据文件:
- 划分集:偏好划分集(preference),路径:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500/preference-*
提供机构:
Mitsuki-Sakamoto
原始信息汇总
数据集概述
数据集配置名称
alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
数据集特征
- instruction: 数据类型 - string
- input: 数据类型 - string
- output: 数据类型 - string
- preference: 数据类型 - int64
- output_1: 数据类型 - string
- output_2: 数据类型 - string
- reward_model_prompt_format: 数据类型 - string
- gen_prompt_format: 数据类型 - string
- gen_kwargs: 结构化数据类型
- do_sample: 数据类型 - bool
- max_new_tokens: 数据类型 - int64
- pad_token_id: 数据类型 - int64
- top_k: 数据类型 - int64
- top_p: 数据类型 - float64
- reward_1: 数据类型 - float64
- reward_2: 数据类型 - float64
- n_samples: 数据类型 - int64
- reject_select: 数据类型 - string
数据集分割
- preference:
- 字节数: 58969064
- 示例数量: 20001
数据集大小
- 下载大小: 26765193
- 数据集大小: 58969064



