orion-research/Aura-Iter2_generated

Name: orion-research/Aura-Iter2_generated
Creator: orion-research
Published: 2024-07-12 09:35:05
License: 暂无描述

Hugging Face2024-07-12 更新2024-07-13 收录

下载链接：

https://hf-mirror.com/datasets/orion-research/Aura-Iter2_generated

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于生成模型的多轮对话数据，主要特征包括prompt、output、generate_0到generate_4等字段，每个generate字段包含content和role两个子字段。数据集仅包含一个训练集，共有3239个样本，总大小为43998859字节。

This dataset contains multi-turn dialogue data for generative models, with main features including prompt, output, generate_0 to generate_4, etc. Each generate field contains two subfields: content and role. The dataset includes only a training set with 3239 samples and a total size of 43998859 bytes.

提供机构：

orion-research

原始信息汇总

数据集概述

数据集信息

特征

prompt: 类型为 string
output: 类型为 string
index_level_0: 类型为 int64
generate_0: 包含以下子特征
- content: 类型为 string
- role: 类型为 string
generate_1: 包含以下子特征
- content: 类型为 string
- role: 类型为 string
generate_2: 包含以下子特征
- content: 类型为 string
- role: 类型为 string
generate_3: 包含以下子特征
- content: 类型为 string
- role: 类型为 string
generate_4: 包含以下子特征
- content: 类型为 string
- role: 类型为 string
probability: 类型为 float64 的序列
rm_scores: 类型为 float32 的序列

数据分割

train: 包含 3239 个样本，占用 43998859 字节

文件大小

下载大小: 23947243 字节
数据集大小: 43998859 字节

配置

default: 包含训练数据文件，路径为 data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集