alvarobartt/social-reasoning-rlhf-ULTRAFEEDBACK-honesty

Name: alvarobartt/social-reasoning-rlhf-ULTRAFEEDBACK-honesty
Creator: alvarobartt
Published: 2023-11-07 12:46:07
License: 暂无描述

Hugging Face2023-11-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/alvarobartt/social-reasoning-rlhf-ULTRAFEEDBACK-honesty

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: input dtype: string - name: generations sequence: string - name: rating sequence: int64 - name: rationale sequence: string - name: labelling_prompt list: - name: content dtype: string - name: role dtype: string - name: raw_labelling_response struct: - name: choices list: - name: finish_reason dtype: string - name: index dtype: int64 - name: message struct: - name: content dtype: string - name: role dtype: string - name: created dtype: int64 - name: id dtype: string - name: model dtype: string - name: object dtype: string - name: usage struct: - name: completion_tokens dtype: int64 - name: prompt_tokens dtype: int64 - name: total_tokens dtype: int64 splits: - name: train num_bytes: 608510 num_examples: 100 download_size: 181787 dataset_size: 608510 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "social-reasoning-rlhf-ULTRAFEEDBACK-honesty" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征： - 字段名：输入（input），数据类型：字符串 - 字段名：生成结果（generations），数据类型：字符串序列 - 字段名：评分（rating），数据类型：64位整数序列 - 字段名：推理依据（rationale），数据类型：字符串序列 - 字段名：标注提示（labelling_prompt），为列表类型，包含： - 子字段：内容（content），数据类型：字符串 - 子字段：角色（role），数据类型：字符串 - 字段名：原始标注响应（raw_labelling_response），为结构体类型，包含： - 子字段：候选结果（choices），为列表类型，每个列表项包含： - 子字段：结束原因（finish_reason），数据类型：字符串 - 子字段：索引（index），数据类型：64位整数 - 子字段：消息（message），为结构体类型，包含： - 子字段：内容（content），数据类型：字符串 - 子字段：角色（role），数据类型：字符串 - 子字段：创建时间戳（created），数据类型：64位整数 - 子字段：响应ID（id），数据类型：字符串 - 子字段：使用模型（model），数据类型：字符串 - 子字段：对象类型（object），数据类型：字符串 - 子字段：令牌使用统计（usage），为结构体类型，包含： - 子字段：补全令牌数（completion_tokens），数据类型：64位整数 - 子字段：提示令牌数（prompt_tokens），数据类型：64位整数 - 子字段：总令牌数（total_tokens），数据类型：64位整数数据划分： - 划分名称：训练集（train），数据字节数：608510，样本数量：100 下载大小：181787 数据集总大小：608510 配置项： - 配置名称：默认（default），数据文件： - 划分：训练集 - 路径：data/train-* # 数据集卡片："social-reasoning-rlhf-ULTRAFEEDBACK-honesty" [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

alvarobartt

原始信息汇总

数据集概述

数据集信息

特征列表:
- input: 类型为 string
- generations: 类型为 string 的序列
- rating: 类型为 int64 的序列
- rationale: 类型为 string 的序列
- labelling_prompt: 列表类型，包含以下字段:
  - content: 类型为 string
  - role: 类型为 string
- raw_labelling_response: 结构类型，包含以下字段:
  - choices: 列表类型，包含以下字段:
    - finish_reason: 类型为 string
    - index: 类型为 int64
    - message: 结构类型，包含以下字段:
      - content: 类型为 string
      - role: 类型为 string
  - created: 类型为 int64
  - id: 类型为 string
  - model: 类型为 string
  - object: 类型为 string
  - usage: 结构类型，包含以下字段:
    - completion_tokens: 类型为 int64
    - prompt_tokens: 类型为 int64
    - total_tokens: 类型为 int64
数据分割:
- train: 包含 100 个样本，占用 608510 字节
数据集大小:
- 下载大小: 181787 字节
- 数据集大小: 608510 字节

配置信息

配置名称: default
数据文件:
- train: 路径为 data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集