five

dvilasuero/multiturner

收藏
Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dvilasuero/multiturner
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: source dtype: string - name: prompt dtype: string - name: chosen list: - name: content dtype: string - name: role dtype: string - name: chosen-rating dtype: float64 - name: chosen-model dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: rejected-rating dtype: float64 - name: rejected-model dtype: string - name: input dtype: string - name: generation_model dtype: string - name: generation_prompt list: - name: content dtype: string - name: role dtype: string - name: raw_generation_responses sequence: string - name: followup sequence: string splits: - name: train num_bytes: 34132394 num_examples: 3431 download_size: 17508262 dataset_size: 34132394 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "multiturner" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征: - 字段名:source,数据类型:字符串 - 字段名:prompt,数据类型:字符串 - 字段名:优选回复(chosen),类型为列表,包含子字段: - content:字符串 - role:字符串 - 字段名:chosen-rating,数据类型:64位浮点数 - 字段名:chosen-model,数据类型:字符串 - 字段名:拒选回复(rejected),类型为列表,包含子字段: - content:字符串 - role:字符串 - 字段名:rejected-rating,数据类型:64位浮点数 - 字段名:rejected-model,数据类型:字符串 - 字段名:input,数据类型:字符串 - 字段名:生成模型(generation_model),数据类型:字符串 - 字段名:生成提示(generation_prompt),类型为列表,包含子字段: - content:字符串 - role:字符串 - 字段名:原始生成响应(raw_generation_responses),数据类型:字符串序列 - 字段名:后续会话(followup),数据类型:字符串序列 数据集划分: - 名称:train,占用字节数:34132394,样本数量:3431 下载大小:17508262,数据集总大小:34132394 配置: - 配置名称:default,数据文件: - 对应划分:train,文件路径:data/train-* --- # 「multiturner」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dvilasuero
原始信息汇总

数据集概述

数据集信息

特征

  • source: 字符串类型
  • prompt: 字符串类型
  • chosen: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • chosen-rating: 浮点数类型
  • chosen-model: 字符串类型
  • rejected: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • rejected-rating: 浮点数类型
  • rejected-model: 字符串类型
  • input: 字符串类型
  • generation_model: 字符串类型
  • generation_prompt: 列表类型
    • content: 字符串类型
    • role: 字符串类型
  • raw_generation_responses: 字符串序列类型
  • followup: 字符串序列类型

分割

  • train:
    • 字节数: 34132394
    • 样本数: 3431

大小

  • 下载大小: 17508262 字节
  • 数据集大小: 34132394 字节

配置

  • default:
    • 数据文件:
      • train: data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务