weijie210/UC_prefs_iter_0
收藏Hugging Face2024-02-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/weijie210/UC_prefs_iter_0
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: critique
dtype: string
- name: post_score
dtype: int64
- name: pre_score
dtype: int64
- name: score_diff
dtype: int64
- name: subsitute
dtype: bool
splits:
- name: train_sft
num_bytes: 90413
num_examples: 16
- name: test_sft
num_bytes: 84859
num_examples: 15
download_size: 135684
dataset_size: 175272
configs:
- config_name: default
data_files:
- split: train_sft
path: data/train_sft-*
- split: test_sft
path: data/test_sft-*
---
数据集信息(dataset_info):
特征字段:
- 名称:提示词(prompt),数据类型:字符串
- 名称:拒选响应(rejected),为列表类型,包含:
- 名称:内容(content),数据类型:字符串
- 名称:角色(role),数据类型:字符串
- 名称:优选响应(chosen),为列表类型,包含:
- 名称:内容(content),数据类型:字符串
- 名称:角色(role),数据类型:字符串
- 名称:评析文本(critique),数据类型:字符串
- 名称:后得分(post_score),数据类型:64位整型(int64)
- 名称:前得分(pre_score),数据类型:64位整型(int64)
- 名称:得分差值(score_diff),数据类型:64位整型(int64)
- 名称:替代标记(subsitute),数据类型:布尔值(bool)
数据集划分:
- 划分名称:训练_SFT(train_sft),字节数:90413,示例数量:16
- 划分名称:测试_SFT(test_sft),字节数:84859,示例数量:15
下载大小:135684,数据集总大小:175272
配置项:
- 配置名称:默认(default),数据文件:
- 对应划分:训练_SFT,路径:data/train_sft-*
- 对应划分:测试_SFT,路径:data/test_sft-*
提供机构:
weijie210
原始信息汇总
数据集概述
数据特征
- prompt: 类型为字符串。
- rejected: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- chosen: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- critique: 类型为字符串。
- post_score: 类型为整数(int64)。
- pre_score: 类型为整数(int64)。
- score_diff: 类型为整数(int64)。
- subsitute: 类型为布尔值(bool)。
数据分割
- train_sft: 包含16个样本,占用90413字节。
- test_sft: 包含15个样本,占用84859字节。
数据集大小
- 下载大小: 135684字节。
- 数据集大小: 175272字节。
配置
- default: 包含以下数据文件:
- train_sft: 路径为
data/train_sft-*。 - test_sft: 路径为
data/test_sft-*。
- train_sft: 路径为



