vwxyzjn/ultrafeedback_binarized_1707921333
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/ultrafeedback_binarized_1707921333
下载链接
链接失效反馈官方服务:
资源简介:
数据集名为ultrafeedback_binarized_1707921333,包含多个特征,如prompt、prompt_id、chosen、rejected、messages、score_chosen、score_rejected、query、query_token、query_token_len、chosen_token、chosen_token_len、rejected_token和rejected_token_len。数据集分为两个部分:test_prefs和train_prefs,分别包含1000个示例。数据集的总下载大小为12976788字节,总数据集大小为33563589字节。
提供机构:
vwxyzjn
原始信息汇总
数据集概述
数据集信息
- 特征列表:
prompt: 类型为字符串。prompt_id: 类型为字符串。chosen: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
rejected: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
messages: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
score_chosen: 类型为浮点数。score_rejected: 类型为浮点数。query: 包含两个子特征:content: 类型为字符串。role: 类型为字符串。
query_token: 类型为整数序列。query_token_len: 类型为整数。chosen_token: 类型为整数序列。chosen_token_len: 类型为整数。rejected_token: 类型为整数序列。rejected_token_len: 类型为整数。
数据集分割
- test_prefs:
- 字节数: 16973857
- 样本数: 1000
- train_prefs:
- 字节数: 16589732
- 样本数: 1000
数据集大小
- 下载大小: 12976788 字节
- 数据集大小: 33563589 字节



