Mitsuki-Sakamoto/alpaca_farm-reward-model-deberta-v3-large-v2-re-preference-64-nsample-2-16_mix_random_seed_1
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Mitsuki-Sakamoto/alpaca_farm-reward-model-deberta-v3-large-v2-re-preference-64-nsample-2-16_mix_random_seed_1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: preference
dtype: int64
- name: output_1
dtype: string
- name: output_2
dtype: string
- name: reward_model_prompt_format
dtype: string
- name: gen_prompt_format
dtype: string
- name: gen_kwargs
struct:
- name: do_sample
dtype: bool
- name: max_new_tokens
dtype: int64
- name: pad_token_id
dtype: int64
- name: top_k
dtype: int64
- name: top_p
dtype: float64
- name: reward_1
dtype: float64
- name: reward_2
dtype: float64
- name: n_samples
dtype: int64
- name: reject_select
dtype: string
- name: index
dtype: int64
splits:
- name: preference
num_bytes: 25889425.028748564
num_examples: 20000
download_size: 12367081
dataset_size: 25889425.028748564
- config_name: alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: preference
dtype: int64
- name: output_1
dtype: string
- name: output_2
dtype: string
- name: reward_model_prompt_format
dtype: string
- name: gen_prompt_format
dtype: string
- name: gen_kwargs
struct:
- name: do_sample
dtype: bool
- name: max_new_tokens
dtype: int64
- name: pad_token_id
dtype: int64
- name: top_k
dtype: int64
- name: top_p
dtype: float64
- name: reward_1
dtype: float64
- name: reward_2
dtype: float64
- name: n_samples
dtype: int64
- name: reject_select
dtype: string
- name: index
dtype: int64
splits:
- name: preference
num_bytes: 25900235.98820059
num_examples: 20000
download_size: 12316110
dataset_size: 25900235.98820059
configs:
- config_name: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
data_files:
- split: preference
path: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500/preference-*
- config_name: alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1
data_files:
- split: preference
path: alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1/preference-*
---
数据集信息:
- 配置名称:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
特征字段:
- 指令(instruction):字符串类型
- 输入(input):字符串类型
- 输出(output):字符串类型
- 偏好(preference):64位整数类型
- 输出1(output_1):字符串类型
- 输出2(output_2):字符串类型
- 奖励模型提示格式(reward_model_prompt_format):字符串类型
- 生成提示格式(gen_prompt_format):字符串类型
- 生成参数配置(gen_kwargs):结构体类型,包含以下字段:
- 采样开关(do_sample):布尔类型
- 最大新Token数(max_new_tokens):64位整数类型
- 填充Token ID(pad_token_id):64位整数类型
- Top-K采样阈值(top_k):64位整数类型
- Top-P采样阈值(top_p):双精度浮点数类型
- 奖励1(reward_1):双精度浮点数类型
- 奖励2(reward_2):双精度浮点数类型
- 样本数(n_samples):64位整数类型
- 拒绝选择(reject_select):字符串类型
- 索引(index):64位整数类型
数据集划分:
- 划分名称:preference
字节大小:25889425.028748564
示例数量:20000
下载大小:12367081
数据集总大小:25889425.028748564
- 配置名称:alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1
特征字段:
- 指令(instruction):字符串类型
- 输入(input):字符串类型
- 输出(output):字符串类型
- 偏好(preference):64位整数类型
- 输出1(output_1):字符串类型
- 输出2(output_2):字符串类型
- 奖励模型提示格式(reward_model_prompt_format):字符串类型
- 生成提示格式(gen_prompt_format):字符串类型
- 生成参数配置(gen_kwargs):结构体类型,包含以下字段:
- 采样开关(do_sample):布尔类型
- 最大新Token数(max_new_tokens):64位整数类型
- 填充Token ID(pad_token_id):64位整数类型
- Top-K采样阈值(top_k):64位整数类型
- Top-P采样阈值(top_p):双精度浮点数类型
- 奖励1(reward_1):双精度浮点数类型
- 奖励2(reward_2):双精度浮点数类型
- 样本数(n_samples):64位整数类型
- 拒绝选择(reject_select):字符串类型
- 索引(index):64位整数类型
数据集划分:
- 划分名称:preference
字节大小:25900235.98820059
示例数量:20000
下载大小:12316110
数据集总大小:25900235.98820059
配置项:
- 配置名称:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
数据文件:
- 划分:preference
文件路径:alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500/preference-*
- 配置名称:alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1
数据文件:
- 划分:preference
文件路径:alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1/preference-*
提供机构:
Mitsuki-Sakamoto
原始信息汇总
数据集概述
数据集配置1
- 配置名称: alpaca_instructions-pythia-1.4b_alpaca_farm_instructions_sft_constant_pa-checkpoint-7500
- 特征:
- instruction: 字符串
- input: 字符串
- output: 字符串
- preference: int64
- output_1: 字符串
- output_2: 字符串
- reward_model_prompt_format: 字符串
- gen_prompt_format: 字符串
- gen_kwargs: 结构体
- do_sample: bool
- max_new_tokens: int64
- pad_token_id: int64
- top_k: int64
- top_p: float64
- reward_1: float64
- reward_2: float64
- n_samples: int64
- reject_select: 字符串
- index: int64
- 数据分割:
- preference: 20000个样本,总大小25889425.028748564字节
- 下载大小: 12367081字节
- 数据集总大小: 25889425.028748564字节
数据集配置2
- 配置名称: alpaca_instructions-pythia_160m_alpaca_farm_instructions_sft_constant_pa_seed_1
- 特征:
- instruction: 字符串
- input: 字符串
- output: 字符串
- preference: int64
- output_1: 字符串
- output_2: 字符串
- reward_model_prompt_format: 字符串
- gen_prompt_format: 字符串
- gen_kwargs: 结构体
- do_sample: bool
- max_new_tokens: int64
- pad_token_id: int64
- top_k: int64
- top_p: float64
- reward_1: float64
- reward_2: float64
- n_samples: int64
- reject_select: 字符串
- index: int64
- 数据分割:
- preference: 20000个样本,总大小25900235.98820059字节
- 下载大小: 12316110字节
- 数据集总大小: 25900235.98820059字节



