lucasmccabe-lmi/oig_small_chip2_python
收藏Hugging Face2023-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lucasmccabe-lmi/oig_small_chip2_python
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为oig_small_chip2_python,是从LAION的Open Instruction Generalist (OIG)数据集中提取的,专门用于Python代码生成。数据集包含4775个提示,这些提示被格式化为instruction/input/output三元组,模拟human和bot之间的对话。数据集适用于文本生成任务,特别是代码生成,大小在1K到10K之间,遵循Apache 2.0许可证。
该数据集名为oig_small_chip2_python,是从LAION的Open Instruction Generalist (OIG)数据集中提取的,专门用于Python代码生成。数据集包含4775个提示,这些提示被格式化为instruction/input/output三元组,模拟human和bot之间的对话。数据集适用于文本生成任务,特别是代码生成,大小在1K到10K之间,遵循Apache 2.0许可证。
提供机构:
lucasmccabe-lmi
原始信息汇总
数据集概述
基本信息
- 数据集名称: oig_small_chip2_python
- 来源: 从LAION的Open Instruction Generalist (OIG) 数据集中提取,专注于Python代码生成。
- 数据集格式: 原始数据为对话形式,后被重构为instruction/input/output三元组。
- 许可证: Apache-2.0
数据集特征
- 特征名称及类型:
- instruction: string
- input: string
- output: string
数据集划分
- 训练集:
- 样本数量: 4742
- 数据大小: 1930175字节
数据集大小
- 下载大小: 741759字节
- 总数据大小: 1930175字节
任务类别
- text-generation
语言
- en
标签
- code
- python
- code-generation
大小分类
- 1K<n<10K



