orion-research/Aura-Iter2_generated
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/orion-research/Aura-Iter2_generated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于生成模型的多轮对话数据,主要特征包括prompt、output、generate_0到generate_4等字段,每个generate字段包含content和role两个子字段。数据集仅包含一个训练集,共有3239个样本,总大小为43998859字节。
This dataset contains multi-turn dialogue data for generative models, with main features including prompt, output, generate_0 to generate_4, etc. Each generate field contains two subfields: content and role. The dataset includes only a training set with 3239 samples and a total size of 43998859 bytes.
提供机构:
orion-research
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 类型为
string - output: 类型为
string - index_level_0: 类型为
int64 - generate_0: 包含以下子特征
- content: 类型为
string - role: 类型为
string
- content: 类型为
- generate_1: 包含以下子特征
- content: 类型为
string - role: 类型为
string
- content: 类型为
- generate_2: 包含以下子特征
- content: 类型为
string - role: 类型为
string
- content: 类型为
- generate_3: 包含以下子特征
- content: 类型为
string - role: 类型为
string
- content: 类型为
- generate_4: 包含以下子特征
- content: 类型为
string - role: 类型为
string
- content: 类型为
- probability: 类型为
float64的序列 - rm_scores: 类型为
float32的序列
数据分割
- train: 包含 3239 个样本,占用 43998859 字节
文件大小
- 下载大小: 23947243 字节
- 数据集大小: 43998859 字节
配置
- default: 包含训练数据文件,路径为
data/train-*



