dvilasuero/multiturner
收藏Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dvilasuero/multiturner
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source
dtype: string
- name: prompt
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: chosen-rating
dtype: float64
- name: chosen-model
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected-rating
dtype: float64
- name: rejected-model
dtype: string
- name: input
dtype: string
- name: generation_model
dtype: string
- name: generation_prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_generation_responses
sequence: string
- name: followup
sequence: string
splits:
- name: train
num_bytes: 34132394
num_examples: 3431
download_size: 17508262
dataset_size: 34132394
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "multiturner"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 字段名:source,数据类型:字符串
- 字段名:prompt,数据类型:字符串
- 字段名:优选回复(chosen),类型为列表,包含子字段:
- content:字符串
- role:字符串
- 字段名:chosen-rating,数据类型:64位浮点数
- 字段名:chosen-model,数据类型:字符串
- 字段名:拒选回复(rejected),类型为列表,包含子字段:
- content:字符串
- role:字符串
- 字段名:rejected-rating,数据类型:64位浮点数
- 字段名:rejected-model,数据类型:字符串
- 字段名:input,数据类型:字符串
- 字段名:生成模型(generation_model),数据类型:字符串
- 字段名:生成提示(generation_prompt),类型为列表,包含子字段:
- content:字符串
- role:字符串
- 字段名:原始生成响应(raw_generation_responses),数据类型:字符串序列
- 字段名:后续会话(followup),数据类型:字符串序列
数据集划分:
- 名称:train,占用字节数:34132394,样本数量:3431
下载大小:17508262,数据集总大小:34132394
配置:
- 配置名称:default,数据文件:
- 对应划分:train,文件路径:data/train-*
---
# 「multiturner」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dvilasuero
原始信息汇总
数据集概述
数据集信息
特征
- source: 字符串类型
- prompt: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- chosen-rating: 浮点数类型
- chosen-model: 字符串类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- rejected-rating: 浮点数类型
- rejected-model: 字符串类型
- input: 字符串类型
- generation_model: 字符串类型
- generation_prompt: 列表类型
- content: 字符串类型
- role: 字符串类型
- raw_generation_responses: 字符串序列类型
- followup: 字符串序列类型
分割
- train:
- 字节数: 34132394
- 样本数: 3431
大小
- 下载大小: 17508262 字节
- 数据集大小: 34132394 字节
配置
- default:
- 数据文件:
- train:
data/train-*
- train:
- 数据文件:



