YYYYYYibo/ultrafeedback_binarized_new_gen_part_2
收藏Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_new_gen_part_2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: prompt_id
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: score_chosen
dtype: float64
- name: score_rejected
dtype: float64
- name: reference_response
dtype: string
splits:
- name: train_prefs
num_bytes: 42331164
num_examples: 5000
download_size: 23430809
dataset_size: 42331164
configs:
- config_name: default
data_files:
- split: train_prefs
path: data/train_prefs-*
---
# Dataset Card for "ultrafeedback_binarized_new_gen_part_2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 字段名: 提示词(prompt)
数据类型: 字符串
- 字段名: 提示词ID(prompt_id)
数据类型: 字符串
- 字段名: 已选回复(chosen)
数据类型: 列表,包含子字段:
- 内容(content):字符串
- 角色(role):字符串
- 字段名: 拒选回复(rejected)
数据类型: 列表,包含子字段:
- 内容(content):字符串
- 角色(role):字符串
- 字段名: 对话消息列表(messages)
数据类型: 列表,包含子字段:
- 内容(content):字符串
- 角色(role):字符串
- 字段名: 已选回复得分(score_chosen)
数据类型: float64
- 字段名: 拒选回复得分(score_rejected)
数据类型: float64
- 字段名: 参考回复(reference_response)
数据类型: 字符串
数据划分:
- 划分名称: 训练偏好集(train_prefs)
占用字节数: 42331164
样本数量: 5000
下载总大小: 23430809
数据集总占用大小: 42331164
配置项:
- 配置名称: 默认(default)
数据文件:
- 对应数据划分: train_prefs
文件路径: data/train_prefs-*
---
# 「ultrafeedback_binarized_new_gen_part_2」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集名称
ultrafeedback_binarized_new_gen_part_2
数据集特征
- prompt (字符串类型)
- prompt_id (字符串类型)
- chosen
- content (字符串类型)
- role (字符串类型)
- rejected
- content (字符串类型)
- role (字符串类型)
- messages
- content (字符串类型)
- role (字符串类型)
- score_chosen (浮点数类型)
- score_rejected (浮点数类型)
- reference_response (字符串类型)
数据集划分
- train_prefs
- 数据大小: 42331164 字节
- 示例数量: 5000
数据集大小
- 下载大小: 23430809 字节
- 数据集总大小: 42331164 字节
配置
- config_name: default
- data_files
- split: train_prefs
- path: data/train_prefs-*



