ShenaoZhang/0.0005_idpo_same_nodpo_replace_dataset
收藏Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ShenaoZhang/0.0005_idpo_same_nodpo_replace_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个分割,每个分割包含一系列的提示(prompt)、消息(messages)、评分(score_chosen和score_rejected)、参考响应(reference_response)以及选定和拒绝的内容。数据集的特征包括字符串、浮点数和布尔类型,适用于训练和测试模型。
该数据集包含多个分割,每个分割包含一系列的提示(prompt)、消息(messages)、评分(score_chosen和score_rejected)、参考响应(reference_response)以及选定和拒绝的内容。数据集的特征包括字符串、浮点数和布尔类型,适用于训练和测试模型。
提供机构:
ShenaoZhang
原始信息汇总
数据集概述
数据集特征
- prompt:字符串类型
- prompt_id:字符串类型
- messages:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- score_chosen:浮点数类型
- score_rejected:浮点数类型
- reference_response:字符串类型
- chosen:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- rejected:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- is_better:布尔类型
数据集分割
- train_prefs_1:
- 字节数:154329828
- 示例数:20378
- test_prefs_1:
- 字节数:15163825
- 示例数:2000
- train_prefs_2:
- 字节数:179782706
- 示例数:20378
- test_prefs_2:
- 字节数:17569119
- 示例数:2000
- train_prefs_3:
- 字节数:168281661
- 示例数:20378
- test_prefs_3:
- 字节数:16351429
- 示例数:2000
数据集大小
- 下载大小:300434639字节
- 数据集大小:551478568字节
配置信息
- config_name:default
- data_files:
- split:train_prefs_1, test_prefs_1, train_prefs_2, test_prefs_2, train_prefs_3, test_prefs_3
- path:data/train_prefs_1-, data/test_prefs_1-, data/train_prefs_2-, data/test_prefs_2-, data/train_prefs_3-, data/test_prefs_3-



