Taywon/hri_rlhf
收藏Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Taywon/hri_rlhf
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
struct:
- name: dataset
dtype: string
- name: id
dtype: string
- name: full_text
dtype: string
- name: quotes_0
sequence:
- name: title
dtype: string
- name: extract
dtype: string
- name: answer_0
dtype: string
- name: tokens_0
struct:
- name: prefix
sequence: int32
- name: completion
sequence: int32
- name: score_0
dtype: float32
- name: quotes_1
sequence:
- name: title
dtype: string
- name: extract
dtype: string
- name: answer_1
dtype: string
- name: tokens_1
struct:
- name: prefix
sequence: int32
- name: completion
sequence: int32
- name: score_1
dtype: float32
- name: input_ids_chosen
sequence: int64
- name: attention_mask_chosen
sequence: int64
- name: input_ids_rejected
sequence: int64
- name: attention_mask_rejected
sequence: int64
splits:
- name: train
num_bytes: 239337866.30222642
num_examples: 12663
- name: eval
num_bytes: 12599727.0
num_examples: 667
download_size: 103209679
dataset_size: 251937593.30222642
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
---
# Dataset Card for "hri_rlhf"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 名称:question
结构体:
- 名称:dataset
数据类型:字符串
- 名称:id
数据类型:字符串
- 名称:full_text
数据类型:字符串
- 名称:quotes_0
序列:
- 名称:title
数据类型:字符串
- 名称:extract
数据类型:字符串
- 名称:answer_0
数据类型:字符串
- 名称:tokens_0
结构体:
- 名称:prefix
序列:int32
- 名称:completion
序列:int32
- 名称:score_0
数据类型:float32
- 名称:quotes_1
序列:
- 名称:title
数据类型:字符串
- 名称:extract
数据类型:字符串
- 名称:answer_1
数据类型:字符串
- 名称:tokens_1
结构体:
- 名称:prefix
序列:int32
- 名称:completion
序列:int32
- 名称:score_1
数据类型:float32
- 名称:input_ids_chosen
序列:int64
- 名称:attention_mask_chosen
序列:int64
- 名称:input_ids_rejected
序列:int64
- 名称:attention_mask_rejected
序列:int64
数据分割:
- 名称:train
字节数:239337866.30222642
样本数:12663
- 名称:eval
字节数:12599727.0
样本数:667
下载大小:103209679
数据集大小:251937593.30222642
配置:
- 配置名称:default
数据文件:
- 分割:train
路径:data/train-*
- 分割:eval
路径:data/eval-*
---
# hri_rlhf数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Taywon
原始信息汇总
数据集概述
数据集特征
-
question
- dataset: 数据类型为字符串
- id: 数据类型为字符串
- full_text: 数据类型为字符串
-
quotes_0
- title: 数据类型为字符串
- extract: 数据类型为字符串
-
answer_0: 数据类型为字符串
-
tokens_0
- prefix: 数据类型为整数序列
- completion: 数据类型为整数序列
-
score_0: 数据类型为浮点数
-
quotes_1
- title: 数据类型为字符串
- extract: 数据类型为字符串
-
answer_1: 数据类型为字符串
-
tokens_1
- prefix: 数据类型为整数序列
- completion: 数据类型为整数序列
-
score_1: 数据类型为浮点数
-
input_ids_chosen: 数据类型为整数序列
-
attention_mask_chosen: 数据类型为整数序列
-
input_ids_rejected: 数据类型为整数序列
-
attention_mask_rejected: 数据类型为整数序列
数据集分割
-
train
- num_bytes: 239337866.30222642
- num_examples: 12663
-
eval
- num_bytes: 12599727.0
- num_examples: 667
数据集大小
- download_size: 103209679
- dataset_size: 251937593.30222642
配置文件
- config_name: default
- data_files
- train: 路径为"data/train-*"
- eval: 路径为"data/eval-*"



