YYYYYYibo/ultrafeedback_binarized_imp_sam_1_vllm_part_2
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_imp_sam_1_vllm_part_2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练偏好模型的多个特征,如提示、提示ID、选择的响应、拒绝的响应、消息等。数据集包含19100个示例,数据大小为286171277字节。
This dataset contains multiple features for training preference models, such as prompts, prompt IDs, chosen responses, rejected responses, messages, etc. The dataset includes 19100 examples with a data size of 286171277 bytes.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
- 特征:
prompt: 类型为字符串。prompt_id: 类型为字符串。chosen: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
rejected: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
messages: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
score_chosen: 类型为浮点数。score_rejected: 类型为浮点数。reference_response: 类型为字符串。resp0: 类型为字符串。resp1: 类型为字符串。resp2: 类型为字符串。resp3: 类型为字符串。
数据集分割
- train_prefs:
- 字节数: 286171277
- 样本数: 19100
数据集大小
- 下载大小: 154788207 字节
- 数据集大小: 286171277 字节
配置
- 配置名称: default
- 数据文件:
- 分割: train_prefs
- 路径: data/train_prefs-*
- 数据文件:



