dev2bit/es2bash
收藏Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dev2bit/es2bash
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一系列西班牙语的自然语言请求及其对应的Bash命令。其主要目的是为机器学习和自然语言处理系统的开发提供示例,特别是与命令行操作相关的系统。数据集包含两个主要特征:自然语言请求(西班牙语)和Bash命令。初始命令包括cat、ls和cd,并计划扩展以涵盖更多常见的命令行命令。数据集的请求是通过语言模型生成和手动添加相结合的方式收集的,并经过手动审查以确保质量和相关性。
提供机构:
dev2bit
原始信息汇总
数据集概述
数据集名称
- ES2Bash
数据集目的
- 提供西班牙语的自然语言请求及其对应的bash命令,以支持机器学习和自然语言处理系统的发展,特别是与命令行操作相关的系统。
数据集特征
- 自然语言请求(ES):包含用西班牙语表达的自然语言请求,代表使用命令行命令执行的任务或动作。
- Bash命令:与每个自然语言请求关联的bash命令,代表执行请求任务或动作的方式。
初始命令
- cat:涉及阅读文本文件的请求。
- ls:与获取特定位置文件和目录信息相关的请求。
- cd:改变当前目录的请求。
数据集扩展
- 计划扩展数据集以包括更多常见的命令行命令,覆盖更广泛的命令行操作任务和动作。
- 将努力改进现有示例,确保其清晰、准确,并代表用户在使用命令行时可能遇到的典型请求。
请求统计
- 未来将提供关于数据集中请求的统计数据,可能包括不同类别请求的分布、不同命令的使用频率等信息,以更好地理解命令行用户的使用和需求。
请求收集过程
- 数据集由语言模型生成的请求和手动添加的请求组合而成。语言模型生成的请求基于现有示例和与命令行使用相关的先验知识。随后进行手动审查以确保请求的质量和相关性。



