vietgpt/alpaca_en
收藏Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vietgpt/alpaca_en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本生成任务的英文数据集,包含名为messages的特征,其中包含content和role两个字段。数据集的大小在10K到100K之间,训练集包含51848个示例,总大小为20207911字节。
This is an English dataset dedicated to text generation tasks. It includes a feature named `messages`, which contains two fields: `content` and `role`. The total number of samples in the dataset ranges from 10K to 100K, the training set consists of 51,848 samples, and its total file size is 20,207,911 bytes.
提供机构:
vietgpt
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 数据集大小: 10K<n<100K
- 任务类型: 文本生成
数据集特征
- 特征名称: messages
- 子特征:
- 名称: content
- 数据类型: 字符串
- 名称: role
- 数据类型: 字符串
- 名称: content
- 子特征:
数据集划分
- 训练集:
- 示例数量: 51848
- 字节数: 20207911
下载与数据集大小
- 下载大小: 11466948
- 数据集大小: 20207911
配置
- 配置名称: default
- 数据文件:
- 划分: 训练
- 路径: data/train-*
- 数据文件:



