tog/dolphin_5k_test
收藏Hugging Face2023-10-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tog/dolphin_5k_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从FLANv2中提取的约100万条数据,并使用GPT-4进行了增强。它适用于文本生成任务,并且可以在商业或非商业用途下使用。数据集包含指令、输入和输出三个特征,训练集包含5000个示例。
This dataset is derived from FLANv2, containing approximately 1 million samples, and enhanced with GPT-4. It is applicable to text generation tasks and permits both commercial and non-commercial use. The dataset includes three core features: instruction, input, and output, with 5000 examples in its training split.
提供机构:
tog
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache-2.0
- 任务类别: 文本生成
数据结构
- 特征:
- instruction: 字符串类型
- input: 字符串类型
- output: 字符串类型
数据划分
- 训练集:
- 字节数: 8726321.400179625
- 样本数: 5000
数据大小
- 下载大小: 4973800
- 数据集大小: 8726321.400179625
配置
- 默认配置:
- 数据文件:
- 训练集: data/train-*
- 数据文件:



