five

AnishJoshi/nl2bash-custom

收藏
Hugging Face2024-05-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AnishJoshi/nl2bash-custom
下载链接
链接失效反馈
官方服务:
资源简介:
nl2bash-custom是一个用于微调大型语言模型以生成Bash代码的自定义数据集。该数据集通过重新格式化和重新洗牌两个原始数据集(nl2bash和NLC2CMD)创建。数据集结构包括训练、开发和测试三个部分,每个部分以JSON文件形式存在。数据集的特征包括序列号、自然语言命令和对应的Bash代码。

nl2bash-custom是一个用于微调大型语言模型以生成Bash代码的自定义数据集。该数据集通过重新格式化和重新洗牌两个原始数据集(nl2bash和NLC2CMD)创建。数据集结构包括训练、开发和测试三个部分,每个部分以JSON文件形式存在。数据集的特征包括序列号、自然语言命令和对应的Bash代码。
提供机构:
AnishJoshi
原始信息汇总

nl2bash-custom 数据集概述

数据集来源

  • nl2bash by TelinaTool
  • NLC2CMD by Magnum Research Group

数据集结构

  • train.json: 训练集
  • dev.json: 开发集
  • test.json: 测试集

数据集特征

  • srno: 输入输出对的序列号
  • nl_command: 自然语言输入命令
  • bash_code: 对应的bash代码

引用文献

  1. Lin, Xi Victoria, et al. "NL2Bash: A Corpus and Semantic Parser for Natural Language Interface to the Linux Operating System." Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC) 2018.
  2. Fu, Quchen, et al. "A Transformer-based Approach for Translating Natural Language to Bash Commands." 2021 20th IEEE International Conference on Machine Learning and Applications (ICMLA).
  3. Fu, Quchen, et al. "NL2CMD: An Updated Workflow for Natural Language to Bash Commands Translation." Journal of Machine Learning Theory, Applications and Practice.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作