sablo/HelpSteer_binarized
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sablo/HelpSteer_binarized
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于DPO(直接偏好优化)的二值化版本的HelpSteer数据集。对于每个唯一的提示,数据集选取了最佳和最差评分的响应,并将其转换为MessagesList格式,存储在chosen和rejected列中。
这是一个用于DPO(直接偏好优化)的二值化版本的HelpSteer数据集。对于每个唯一的提示,数据集选取了最佳和最差评分的响应,并将其转换为MessagesList格式,存储在chosen和rejected列中。
提供机构:
sablo
原始信息汇总
数据集概述
数据集信息
- 语言: 英语
- 许可证: CC BY 4.0
数据集特征
- prompt: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- score_chosen: 浮点数类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- score_rejected: 浮点数类型
数据集分割
- train:
- 字节数: 69199364
- 样本数: 8130
- test:
- 字节数: 3597313
- 样本数: 418
数据集大小
- 下载大小: 42251007 字节
- 数据集大小: 72796677 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: test
- path: data/test-*
- split: train
- data_files:
标签
- human-feedback



