five

Nan-Do/instructional_code-search-net-java

收藏
Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nan-Do/instructional_code-search-net-java
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于Java编程的指令数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的来源是code-search-net数据集的简化版本,注释过程使用了模板和NLP技术来生成类似人类的指令和响应。

这是一个用于Java编程的指令数据集。数据集包含两种不同的任务:给定一段代码生成其功能的描述,以及给定一个描述生成满足该描述的代码片段。数据集创建于2023年5月,旨在提高大型语言模型的编码能力。数据集的来源是code-search-net数据集的简化版本,注释过程使用了模板和NLP技术来生成类似人类的指令和响应。
提供机构:
Nan-Do
原始信息汇总

数据集卡片 "instructional_code-search-net-java"

数据集描述

数据集概述

这是一个用于Java的教学数据集。数据集包含两种不同的任务:

  • 给定一段代码,生成其功能的描述。
  • 给定一个描述,生成满足该描述的代码段。

语言

数据集使用英语。

数据分割

数据集没有分割。

数据集创建

创建理由

该数据集旨在提高大型语言模型(LLMs)的编程能力。

源数据

数据集的摘要版本可以在这里找到。

标注

数据集包括指令和响应列。

标注过程

标注过程使用模板和自然语言处理技术生成类似人类的指令和响应。标注过程的示例笔记本可以在这里找到。标注已经过清理,确保没有重复或无意义的摘要。

许可信息

Apache 2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作