ShenaoZ/ultrafeedback_subset
收藏Hugging Face2024-04-03 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ShenaoZ/ultrafeedback_subset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如提示、提示ID、选择的回答、拒绝的回答、消息内容以及选择的回答和拒绝的回答的得分。数据集分为两个部分:test_prefs和train_prefs,分别包含2000和20000个示例。数据集的下载大小为80662994字节,总大小为144835595字节。
该数据集包含多个特征,如提示、提示ID、选择的回答、拒绝的回答、消息内容以及选择的回答和拒绝的回答的得分。数据集分为两个部分:test_prefs和train_prefs,分别包含2000和20000个示例。数据集的下载大小为80662994字节,总大小为144835595字节。
提供机构:
ShenaoZ
原始信息汇总
数据集概述
数据集特征
- prompt:字符串类型
- prompt_id:字符串类型
- chosen:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- rejected:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- messages:列表类型,包含以下字段:
- content:字符串类型
- role:字符串类型
- score_chosen:浮点数类型(float64)
- score_rejected:浮点数类型(float64)
数据集分割
- test_prefs:
- 字节数:13161585
- 示例数:2000
- train_prefs:
- 字节数:131674010
- 示例数:20000
数据集大小
- 下载大小:80662994字节
- 数据集大小:144835595字节
配置文件
- config_name:default
- data_files:
- test_prefs:路径为
data/test_prefs-* - train_prefs:路径为
data/train_prefs-*
- test_prefs:路径为



