five

lucasmccabe-lmi/oig_small_chip2_python

收藏
Hugging Face2023-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lucasmccabe-lmi/oig_small_chip2_python
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为oig_small_chip2_python,是从LAION的Open Instruction Generalist (OIG)数据集中提取的,专门用于Python代码生成。数据集包含4775个提示,这些提示被格式化为instruction/input/output三元组,模拟human和bot之间的对话。数据集适用于文本生成任务,特别是代码生成,大小在1K到10K之间,遵循Apache 2.0许可证。

该数据集名为oig_small_chip2_python,是从LAION的Open Instruction Generalist (OIG)数据集中提取的,专门用于Python代码生成。数据集包含4775个提示,这些提示被格式化为instruction/input/output三元组,模拟human和bot之间的对话。数据集适用于文本生成任务,特别是代码生成,大小在1K到10K之间,遵循Apache 2.0许可证。
提供机构:
lucasmccabe-lmi
原始信息汇总

数据集概述

基本信息

  • 数据集名称: oig_small_chip2_python
  • 来源: 从LAION的Open Instruction Generalist (OIG) 数据集中提取,专注于Python代码生成。
  • 数据集格式: 原始数据为对话形式,后被重构为instruction/input/output三元组。
  • 许可证: Apache-2.0

数据集特征

  • 特征名称及类型:
    • instruction: string
    • input: string
    • output: string

数据集划分

  • 训练集:
    • 样本数量: 4742
    • 数据大小: 1930175字节

数据集大小

  • 下载大小: 741759字节
  • 总数据大小: 1930175字节

任务类别

  • text-generation

语言

  • en

标签

  • code
  • python
  • code-generation

大小分类

  • 1K<n<10K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作