sfanm/ultrafeedback_llama3_pad_rm
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sfanm/ultrafeedback_llama3_pad_rm
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: prompt_id
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: score_chosen
dtype: float64
- name: score_rejected
dtype: float64
- name: llama_prompt
dtype: string
- name: llama_prompt_tokens
sequence: int64
- name: llama_chosen_tokens
sequence: int64
- name: llama_rejected_tokens
sequence: int64
- name: llama_query_chosen_tokens
sequence: int64
- name: llama_query_rejected_tokens
sequence: int64
- name: eurus_prompt
dtype: string
- name: eurus_prompt_tokens
sequence: int64
splits:
- name: train_prefs
num_bytes: 4090264059
num_examples: 56362
download_size: 469635001
dataset_size: 4090264059
---
# Dataset Card for "ultrafeedback_llama3_pad_rm"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
dataset_info:
特征列表:
- 特征项:prompt(提示),数据类型:字符串
- 特征项:prompt_id(提示ID),数据类型:字符串
- 特征项:chosen(优选响应序列),数据类型:列表,包含子特征项:
- content(内容):字符串类型
- role(角色):字符串类型
- 特征项:rejected(弃选响应序列),数据类型:列表,包含子特征项:
- content(内容):字符串类型
- role(角色):字符串类型
- 特征项:messages(对话消息序列),数据类型:列表,包含子特征项:
- content(内容):字符串类型
- role(角色):字符串类型
- 特征项:score_chosen(优选响应得分),数据类型:float64(64位浮点型)
- 特征项:score_rejected(弃选响应得分),数据类型:float64(64位浮点型)
- 特征项:llama_prompt(Llama格式提示),数据类型:字符串
- 特征项:llama_prompt_tokens(Llama格式提示Token序列),数据类型:int64(64位整型)序列
- 特征项:llama_chosen_tokens(优选响应的Llama格式Token序列),数据类型:64位整型序列
- 特征项:llama_rejected_tokens(弃选响应的Llama格式Token序列),数据类型:64位整型序列
- 特征项:llama_query_chosen_tokens(带查询的优选响应Llama格式Token序列),数据类型:64位整型序列
- 特征项:llama_query_rejected_tokens(带查询的弃选响应Llama格式Token序列),数据类型:64位整型序列
- 特征项:eurus_prompt(Eurus格式提示),数据类型:字符串
- 特征项:eurus_prompt_tokens(Eurus格式提示Token序列),数据类型:64位整型序列
数据集划分:
- 划分名称:train_prefs(训练偏好集),占用字节数:4090264059,样本数量:56362
下载大小:469635001字节
数据集总占用大小:4090264059字节
---
# "ultrafeedback_llama3_pad_rm" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
sfanm



