mlabonne/CodeLlama-2-20k
收藏Hugging Face2023-07-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mlabonne/CodeLlama-2-20k
下载链接
链接失效反馈官方服务:
资源简介:
CodeLlama-2-20k数据集是基于CodeAlpaca-20k数据集的一个版本,采用了Llama 2的提示格式。该数据集包含20022个训练样本,总大小为9551210字节。数据集的特征为文本(text),数据类型为字符串。数据集的格式转换过程通过Python代码实现,将原始数据集中的指令、输入和输出三列合并为一列,并应用了Llama 2的提示格式。
CodeLlama-2-20k数据集是基于CodeAlpaca-20k数据集的一个版本,采用了Llama 2的提示格式。该数据集包含20022个训练样本,总大小为9551210字节。数据集的特征为文本(text),数据类型为字符串。数据集的格式转换过程通过Python代码实现,将原始数据集中的指令、输入和输出三列合并为一列,并应用了Llama 2的提示格式。
提供机构:
mlabonne
原始信息汇总
数据集概述
基本信息
- 名称: CodeLlama-2-20k
- 许可证: cc-by-4.0
数据结构
- 特征:
- text: 字符串类型
数据分割
- 训练集:
- 示例数量: 20022
- 存储大小: 9551210字节
下载信息
- 下载大小: 3551225字节
- 数据集大小: 9551210字节
任务类别
- 任务: 文本生成
语言
- 语言: 英语
标签
- 标签: 代码



