Mitsuki-Sakamoto/hh-rlhf-reward-model-deberta-v3-large-v2-harmless-2-original_mix_90_random_seed_2
收藏Hugging Face2024-06-08 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Mitsuki-Sakamoto/hh-rlhf-reward-model-deberta-v3-large-v2-harmless-2-original_mix_90_random_seed_2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如chosen和rejected字符串,以及奖励模型提示格式、奖励值、索引等。数据集分为训练和测试两个部分,分别包含42536和2311个样本。数据集的配置包括默认配置,指定了数据文件的路径。
该数据集包含多个特征,如chosen和rejected字符串,以及奖励模型提示格式、奖励值、索引等。数据集分为训练和测试两个部分,分别包含42536和2311个样本。数据集的配置包括默认配置,指定了数据文件的路径。
提供机构:
Mitsuki-Sakamoto
原始信息汇总
数据集概述
数据集信息
特征
- chosen: 类型为字符串
- rejected: 类型为字符串
- reward_model_prompt_format: 类型为字符串
- reward_1: 类型为浮点数
- reward_2: 类型为浮点数
- index: 类型为整数
- generate_format_dict: 类型为字符串
- gen_kwargs: 结构化数据
- do_sample: 类型为布尔值
- max_new_tokens: 类型为整数
- pad_token_id: 类型为整数
- top_k: 类型为整数
- top_p: 类型为浮点数
- n_samples: 类型为整数
- reject_select: 类型为字符串
数据分割
- train: 包含42536个样本,占用99998874.57667443字节
- test: 包含2311个样本,占用5542190.321583045字节
数据集大小
- 下载大小: 64969385字节
- 数据集总大小: 105541064.89825748字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



