Nan-Do/instructional_code-search-net-python
收藏Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nan-Do/instructional_code-search-net-python
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于Python的教学数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码。数据集旨在提高大型语言模型的编码能力。数据集的注释过程使用了模板和NLP技术,确保生成人类可读的指令和响应。数据集的语言为英语,创建于2023年5月,源数据来自code-search-net数据集的Python版本。
提供机构:
Nan-Do
原始信息汇总
数据集概述
数据集名称
- 名称:Instructional Python Dataset
- 别名:instructional_code-search-net-python
数据集特征
- 特征名称:
- INSTRUCTION
- RESPONSE
- SOURCE
- 数据类型:
- INSTRUCTION: string
- RESPONSE: string
- SOURCE: string
数据集大小
- 下载大小:172777462 字节
- 数据集大小:451473573 字节
- 训练集:
- 示例数量:418545
- 字节数:451473573
许可证
- Apache-2.0
任务类别
- 对话
- 文本生成
- 文本到文本生成
语言
- 英语
标签
- Python
- 代码生成
- 指令响应
数据集创建
- 创建时间:2023年5月
数据集用途
- 用于提高大型语言模型(LLMs)的编程能力
数据来源
- 基于code-search-net数据集的摘要版本,可访问:https://huggingface.co/datasets/Nan-Do/code-search-net-python
注释信息
- 包含内容:指令和响应列
- 注释过程:使用模板和NLP技术生成类似人类的指令和响应
- 注释质量:经过清理,确保无重复或无意义的摘要
联系方式
- 联系人:@Nan-Do



