Nan-Do/instructional_code-search-net-javacript
收藏Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nan-Do/instructional_code-search-net-javacript
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于JavaScript的教学数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集为英文,创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的注释过程使用了模板和NLP技术,以确保生成类似人类的指令和响应,并进行了清理以避免重复或无意义的摘要。
这是一个用于JavaScript的教学数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集为英文,创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的注释过程使用了模板和NLP技术,以确保生成类似人类的指令和响应,并进行了清理以避免重复或无意义的摘要。
提供机构:
Nan-Do
原始信息汇总
数据集概述
数据集名称
- 名称:Instructional JavaScript Dataset
- 别名:instructional_code-search-net-javascript
数据集特征
- 特征名称:
- INSTRUCTION
- RESPONSE
- SOURCE
- 数据类型:
- INSTRUCTION: string
- RESPONSE: string
- SOURCE: string
数据集大小
- 下载大小:49942966字节
- 数据集大小:126970947字节
数据集分割
- 训练集:
- 字节数:126970947
- 示例数:121323
许可证
- 许可证类型:Apache-2.0
任务类别
- 对话
- 文本生成
- 文本到文本生成
语言
- 英语 (en)
标签
- JavaScript
- 代码生成
- 指令响应
数据集创建
- 创建时间:2023年5月
数据集用途
- 用于提升大型语言模型(LLMs)的编程能力。
数据来源
- 基于code-search-net数据集的摘要版本,可访问:https://huggingface.co/datasets/Nan-Do/code-search-net-javascript
注释信息
- 注释内容:包括指令和响应列
- 注释过程:使用模板和NLP技术生成类似人类的指令和响应
- 示例笔记本:https://github.com/Nan-Do/OpenAssistantInstructionResponsePython
- 注释质量:经过清理,确保无重复或无意义的摘要



