YYYYYYibo/eval-dataset-vanilla
收藏Hugging Face2024-05-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/eval-dataset-vanilla
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: prompt_id
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: score_chosen
dtype: float64
- name: score_rejected
dtype: float64
- name: reference_response
dtype: string
- name: vanilla
dtype: string
- name: gpt_score
dtype: int64
splits:
- name: train_prefs
num_bytes: 1995726
num_examples: 200
download_size: 1165539
dataset_size: 1995726
configs:
- config_name: default
data_files:
- split: train_prefs
path: data/train_prefs-*
---
# Dataset Card for "eval-dataset-vanilla"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:提示词(prompt),数据类型:字符串(string)
- 名称:提示词ID(prompt_id),数据类型:字符串(string)
- 名称:优选回复(chosen),为列表类型,包含:
- 内容(content):字符串类型
- 角色(role):字符串类型
- 名称:落选回复(rejected),为列表类型,包含:
- 内容(content):字符串类型
- 角色(role):字符串类型
- 名称:对话消息(messages),为列表类型,包含:
- 内容(content):字符串类型
- 角色(role):字符串类型
- 名称:优选回复得分(score_chosen),数据类型:64位浮点数(float64)
- 名称:落选回复得分(score_rejected),数据类型:64位浮点数(float64)
- 名称:参考回复(reference_response),数据类型:字符串(string)
- 名称:原生回复(vanilla),数据类型:字符串(string)
- 名称:GPT评分(gpt_score),数据类型:64位整数(int64)
数据子集划分:
- 子集名称:训练偏好子集(train_prefs),字节占用量:1995726,样本数量:200
下载大小:1165539
数据集总大小:1995726
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 对应子集:训练偏好子集(train_prefs),文件路径:data/train_prefs-*
# 「eval-dataset-vanilla」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集名称
- eval-dataset-vanilla
数据集特征
- prompt: 数据类型 - string
- prompt_id: 数据类型 - string
- chosen:
- content: 数据类型 - string
- role: 数据类型 - string
- rejected:
- content: 数据类型 - string
- role: 数据类型 - string
- messages:
- content: 数据类型 - string
- role: 数据类型 - string
- score_chosen: 数据类型 - float64
- score_rejected: 数据类型 - float64
- reference_response: 数据类型 - string
- vanilla: 数据类型 - string
- gpt_score: 数据类型 - int64
数据集分割
- train_prefs:
- 数据大小: 1995726 字节
- 示例数量: 200
数据集大小
- 下载大小: 1165539 字节
- 数据集大小: 1995726 字节
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*



