Nan-Do/instructional_code-search-net-ruby
收藏Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nan-Do/instructional_code-search-net-ruby
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于Ruby编程语言的教学数据集。数据集包含两种不同的任务:根据代码生成描述和根据描述生成代码。数据集的创建目的是提高大型语言模型(LLMs)的编码能力。数据集的特征包括INSTRUCTION、RESPONSE和SOURCE,且所有数据均为英文。数据集的创建时间为2023年5月,使用了code-search-net数据集的Ruby版本作为源数据,并通过模板和NLP技术生成人类类似的指令和响应。数据集遵循Apache 2.0许可证。
这是一个用于Ruby编程语言的教学数据集。数据集包含两种不同的任务:根据代码生成描述和根据描述生成代码。数据集的创建目的是提高大型语言模型(LLMs)的编码能力。数据集的特征包括INSTRUCTION、RESPONSE和SOURCE,且所有数据均为英文。数据集的创建时间为2023年5月,使用了code-search-net数据集的Ruby版本作为源数据,并通过模板和NLP技术生成人类类似的指令和响应。数据集遵循Apache 2.0许可证。
提供机构:
Nan-Do
原始信息汇总
数据集概述
数据集名称
- 名称:Instructional Ruby Dataset
- 别名:instructional_code-search-net-ruby
数据集特征
- 特征名称:
- INSTRUCTION
- RESPONSE
- SOURCE
- 数据类型:
- INSTRUCTION: string
- RESPONSE: string
- SOURCE: string
数据集大小
- 下载大小:12427089字节
- 数据集大小:30679722字节
数据集分割
- 训练集:
- 大小:30679722字节
- 示例数:51470
许可证
- 许可证类型:Apache-2.0
任务类别
- 对话
- 文本生成
- 文本到文本生成
语言
- 英语
标签
- Ruby
- 代码生成
- 指令响应
数据集创建
- 创建时间:2023年5月
数据集用途
- 用于提升大型语言模型(LLMs)的编程能力。
源数据
- 源数据概述:code-search-net数据集的摘要版本
- 源数据链接:https://huggingface.co/datasets/Nan-Do/code-search-net-ruby
注释
- 注释内容:指令和响应
- 注释过程:使用模板和NLP技术生成类似人类的指令和响应
- 注释质量保证:确保无重复或无意义的摘要
联系人
- 联系人:@Nan-Do



