erfanzar/GPT4-8K

Name: erfanzar/GPT4-8K
Creator: erfanzar
Published: 2023-09-07 11:04:23
License: 暂无描述

Hugging Face2023-09-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/erfanzar/GPT4-8K

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用OpenAI开发的强大语言模型GPT-4生成，包含用户与助手之间的对话集合，以及额外的信息。数据集包括以下特征：对话（用户与助手之间的对话序列）、用户（用户在对话中的输入序列）、助手（助手在对话中的响应序列）和Llama2提示（与Llama2模型相关的额外提示信息）。数据集分为训练集，包含6,144个例子，总大小为193,605,433字节。该数据集主要用于研究和实验目的，可能包含合成或模拟数据。

This dataset was generated using GPT-4, containing sequences of dialogs between a user and an assistant, along with additional prompt information related to the Llama2 model. The dataset is divided into a training set with 6,144 examples, totaling 193,605,433 bytes. It is suitable for tasks such as text classification, translation, conversational, text generation, and summarization, primarily in English.

提供机构：

erfanzar

原始信息汇总

数据集描述

该数据集由GPT-4生成，包含用户和助手之间的对话以及额外信息。

数据集配置

数据集包含以下配置：

配置名称： default
- 数据文件：
  - 分割： train
    - 路径： data/train-*

数据集信息

数据集包含以下特征：

对话： 表示用户和助手之间对话的字符串序列。
用户： 表示用户在对话中输入的字符串序列。
助手： 表示助手在对话中响应的字符串序列。
Llama2提示： 表示与Llama2模型相关的额外提示信息的字符串。

数据集分为以下分割：

训练集：
- 字节数： 193,605,433
- 示例数： 6,144

数据集大小和下载

下载大小： 90,877,640 字节
数据集大小： 193,605,433 字节

请注意，该数据集由GPT-4生成，可能包含合成或模拟数据，旨在用于研究和实验目的。

5,000+

优质数据集

54 个

任务类型

进入经典数据集