five

erfanzar/GPT4-8K

收藏
Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erfanzar/GPT4-8K
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用OpenAI开发的强大语言模型GPT-4生成,包含用户与助手之间的对话集合,以及额外的信息。数据集包括以下特征:对话(用户与助手之间的对话序列)、用户(用户在对话中的输入序列)、助手(助手在对话中的响应序列)和Llama2提示(与Llama2模型相关的额外提示信息)。数据集分为训练集,包含6,144个例子,总大小为193,605,433字节。该数据集主要用于研究和实验目的,可能包含合成或模拟数据。

This dataset was generated using GPT-4, containing sequences of dialogs between a user and an assistant, along with additional prompt information related to the Llama2 model. The dataset is divided into a training set with 6,144 examples, totaling 193,605,433 bytes. It is suitable for tasks such as text classification, translation, conversational, text generation, and summarization, primarily in English.
提供机构:
erfanzar
原始信息汇总

数据集描述

该数据集由GPT-4生成,包含用户和助手之间的对话以及额外信息。

数据集配置

数据集包含以下配置:

  • 配置名称: default
    • 数据文件:
      • 分割: train
        • 路径: data/train-*

数据集信息

数据集包含以下特征:

  • 对话: 表示用户和助手之间对话的字符串序列。
  • 用户: 表示用户在对话中输入的字符串序列。
  • 助手: 表示助手在对话中响应的字符串序列。
  • Llama2提示: 表示与Llama2模型相关的额外提示信息的字符串。

数据集分为以下分割:

  • 训练集:
    • 字节数: 193,605,433
    • 示例数: 6,144

数据集大小和下载

  • 下载大小: 90,877,640 字节
  • 数据集大小: 193,605,433 字节

请注意,该数据集由GPT-4生成,可能包含合成或模拟数据,旨在用于研究和实验目的。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作