alvarobartt/social-reasoning-rlhf-ULTRAFEEDBACK-honesty
收藏Hugging Face2023-11-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/social-reasoning-rlhf-ULTRAFEEDBACK-honesty
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: input
dtype: string
- name: generations
sequence: string
- name: rating
sequence: int64
- name: rationale
sequence: string
- name: labelling_prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_labelling_response
struct:
- name: choices
list:
- name: finish_reason
dtype: string
- name: index
dtype: int64
- name: message
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: created
dtype: int64
- name: id
dtype: string
- name: model
dtype: string
- name: object
dtype: string
- name: usage
struct:
- name: completion_tokens
dtype: int64
- name: prompt_tokens
dtype: int64
- name: total_tokens
dtype: int64
splits:
- name: train
num_bytes: 608510
num_examples: 100
download_size: 181787
dataset_size: 608510
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "social-reasoning-rlhf-ULTRAFEEDBACK-honesty"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 字段名:输入(input),数据类型:字符串
- 字段名:生成结果(generations),数据类型:字符串序列
- 字段名:评分(rating),数据类型:64位整数序列
- 字段名:推理依据(rationale),数据类型:字符串序列
- 字段名:标注提示(labelling_prompt),为列表类型,包含:
- 子字段:内容(content),数据类型:字符串
- 子字段:角色(role),数据类型:字符串
- 字段名:原始标注响应(raw_labelling_response),为结构体类型,包含:
- 子字段:候选结果(choices),为列表类型,每个列表项包含:
- 子字段:结束原因(finish_reason),数据类型:字符串
- 子字段:索引(index),数据类型:64位整数
- 子字段:消息(message),为结构体类型,包含:
- 子字段:内容(content),数据类型:字符串
- 子字段:角色(role),数据类型:字符串
- 子字段:创建时间戳(created),数据类型:64位整数
- 子字段:响应ID(id),数据类型:字符串
- 子字段:使用模型(model),数据类型:字符串
- 子字段:对象类型(object),数据类型:字符串
- 子字段:令牌使用统计(usage),为结构体类型,包含:
- 子字段:补全令牌数(completion_tokens),数据类型:64位整数
- 子字段:提示令牌数(prompt_tokens),数据类型:64位整数
- 子字段:总令牌数(total_tokens),数据类型:64位整数
数据划分:
- 划分名称:训练集(train),数据字节数:608510,样本数量:100
下载大小:181787
数据集总大小:608510
配置项:
- 配置名称:默认(default),数据文件:
- 划分:训练集
- 路径:data/train-*
# 数据集卡片:"social-reasoning-rlhf-ULTRAFEEDBACK-honesty"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
alvarobartt
原始信息汇总
数据集概述
数据集信息
-
特征列表:
input: 类型为stringgenerations: 类型为string的序列rating: 类型为int64的序列rationale: 类型为string的序列labelling_prompt: 列表类型,包含以下字段:content: 类型为stringrole: 类型为string
raw_labelling_response: 结构类型,包含以下字段:choices: 列表类型,包含以下字段:finish_reason: 类型为stringindex: 类型为int64message: 结构类型,包含以下字段:content: 类型为stringrole: 类型为string
created: 类型为int64id: 类型为stringmodel: 类型为stringobject: 类型为stringusage: 结构类型,包含以下字段:completion_tokens: 类型为int64prompt_tokens: 类型为int64total_tokens: 类型为int64
-
数据分割:
train: 包含 100 个样本,占用 608510 字节
-
数据集大小:
- 下载大小: 181787 字节
- 数据集大小: 608510 字节
配置信息
- 配置名称:
default - 数据文件:
train: 路径为data/train-*



