erfanzar/Flan-GPT4
收藏Hugging Face2023-12-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erfanzar/Flan-GPT4
下载链接
链接失效反馈官方服务:
资源简介:
Flan-GPT4数据集是一个用于训练和评估语言生成模型的提示和响应集合。它包含多个特征,如response(响应)、instruction(指令)、system(系统)、toxin_prompt(毒性提示)和llama_prompt(llama提示),所有特征的数据类型均为字符串。数据集主要用于自然语言处理和文本生成任务。数据集包含一个训练集,包含724,248个示例,大小为4,093,492,977字节。
Flan-GPT4数据集是一个用于训练和评估语言生成模型的提示和响应集合。它包含多个特征,如response(响应)、instruction(指令)、system(系统)、toxin_prompt(毒性提示)和llama_prompt(llama提示),所有特征的数据类型均为字符串。数据集主要用于自然语言处理和文本生成任务。数据集包含一个训练集,包含724,248个示例,大小为4,093,492,977字节。
提供机构:
erfanzar
原始信息汇总
Flan-GPT4 数据集
概述
Flan-GPT4 数据集是一系列用于训练和评估语言生成模型的提示和响应集合。它包含多种特征,如 response、instruction、system、toxin_prompt 和 llama_prompt,每个特征的数据类型均为字符串。
数据集信息
-
特征:
- response (字符串)
- instruction (字符串)
- system (字符串)
- toxin_prompt (字符串)
- llama_prompt (字符串)
-
分割:
- 训练集:
- 样本数量: 724,248
- 大小: 4,093,492,977 字节
- 训练集:
预期用途
该数据集旨在用于训练和评估专注于自然语言处理和文本生成任务的语言生成模型。



