Nan-Do/instructional_code-search-net-java
收藏Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nan-Do/instructional_code-search-net-java
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于Java编程的指令数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的来源是code-search-net数据集的简化版本,注释过程使用了模板和NLP技术来生成类似人类的指令和响应。
这是一个用于Java编程的指令数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的来源是code-search-net数据集的简化版本,注释过程使用了模板和NLP技术来生成类似人类的指令和响应。
提供机构:
Nan-Do
原始信息汇总
数据集卡片 "instructional_code-search-net-java"
数据集描述
数据集概述
这是一个用于Java的教学数据集。数据集包含两种不同的任务:
- 给定一段代码,生成其功能的描述。
- 给定一个描述,生成满足该描述的代码段。
语言
数据集使用英语。
数据分割
数据集没有分割。
数据集创建
创建理由
该数据集旨在提高大型语言模型(LLMs)的编程能力。
源数据
数据集的摘要版本可以在这里找到。
标注
数据集包括指令和响应列。
标注过程
标注过程使用模板和自然语言处理技术生成类似人类的指令和响应。标注过程的示例笔记本可以在这里找到。标注已经过清理,确保没有重复或无意义的摘要。
许可信息
Apache 2.0



