mwitiderrick/glaive-code-assistant
收藏Hugging Face2023-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mwitiderrick/glaive-code-assistant
下载链接
链接失效反馈官方服务:
资源简介:
Glaive Code Assistant数据集是一个用于训练助手模型的文本生成数据集,包含136,109个训练样本,总大小为210,090,644字节。数据集采用Apache 2.0许可证,主要面向英语文本生成任务。数据集的提示模板为`<s>[INST] {question} [/INST] {answer} </s>`,训练后的模型可以使用Llama风格的提示方式`<s>[INST] {{ user_msg }} [/INST]`进行提问。
Glaive Code Assistant数据集是一个用于训练助手模型的文本生成数据集,包含136,109个训练样本,总大小为210,090,644字节。数据集采用Apache 2.0许可证,主要面向英语文本生成任务。数据集的提示模板为`<s>[INST] {question} [/INST] {answer} </s>`,训练后的模型可以使用Llama风格的提示方式`<s>[INST] {{ user_msg }} [/INST]`进行提问。
提供机构:
mwitiderrick
原始信息汇总
数据集概述
数据集信息
-
特征:
- 名称: text
- 数据类型: string
-
分割:
- 名称: train
- 字节数: 210090644
- 样本数: 136109
-
下载大小: 100891258
-
数据集大小: 210090644
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
许可证
- apache-2.0
任务类别
- text-generation
语言
- en
数据集名称
- Glaive Code Assistant
数据集大小类别
- 100K<n<1M



