erfanzar/GPT4-8K
收藏Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erfanzar/GPT4-8K
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用OpenAI开发的强大语言模型GPT-4生成,包含用户与助手之间的对话集合,以及额外的信息。数据集包括以下特征:对话(用户与助手之间的对话序列)、用户(用户在对话中的输入序列)、助手(助手在对话中的响应序列)和Llama2提示(与Llama2模型相关的额外提示信息)。数据集分为训练集,包含6,144个例子,总大小为193,605,433字节。该数据集主要用于研究和实验目的,可能包含合成或模拟数据。
This dataset was generated using GPT-4, containing sequences of dialogs between a user and an assistant, along with additional prompt information related to the Llama2 model. The dataset is divided into a training set with 6,144 examples, totaling 193,605,433 bytes. It is suitable for tasks such as text classification, translation, conversational, text generation, and summarization, primarily in English.
提供机构:
erfanzar
原始信息汇总
数据集描述
该数据集由GPT-4生成,包含用户和助手之间的对话以及额外信息。
数据集配置
数据集包含以下配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: train
- 数据文件:
数据集信息
数据集包含以下特征:
- 对话: 表示用户和助手之间对话的字符串序列。
- 用户: 表示用户在对话中输入的字符串序列。
- 助手: 表示助手在对话中响应的字符串序列。
- Llama2提示: 表示与Llama2模型相关的额外提示信息的字符串。
数据集分为以下分割:
- 训练集:
- 字节数: 193,605,433
- 示例数: 6,144
数据集大小和下载
- 下载大小: 90,877,640 字节
- 数据集大小: 193,605,433 字节
请注意,该数据集由GPT-4生成,可能包含合成或模拟数据,旨在用于研究和实验目的。



