five

bigcode/ta-prompt

收藏
Hugging Face2023-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigcode/ta-prompt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专用于与starcoder模型进行上下文学习的提示。模型是一个自回归语言模型,训练于代码和自然语言文本上,可以通过在8192个标记的上下文窗口前添加对话,将其转变为AI技术支持助手。数据格式为包含多个人类与助手之间对话的.txt文件。使用案例包括代码到文本、文本到代码、代码到代码、文本到文本以及通用问答。工作范围强调了模型专注于编码任务,不适用于通用问题。
提供机构:
bigcode
原始信息汇总

数据集概述

许可证

  • 类型: Apache-2.0

语言

  • 包含: 代码

编程语言

  • 支持: Java, JavaScript, Python

数据集内容

  • 目的: 用于在starcoder模型上进行上下文学习的提示集合。
  • 模型特性: 自回归语言模型,训练于代码和自然语言文本,可转变为AI技术助手。
  • 上下文窗口: 8192个令牌。

格式

  • 文件类型: .txt

  • 内容结构: 包含多轮人类与助手的对话,格式如下:


    Human: <instruction> Assistant: <answer>


    Human: <instruction> Assistant: <answer> Human: <instruction> Assistant: <answer> . . .

使用案例

  • 代码到文本:
    • 分析代码目的
    • 识别代码中的错误
  • 文本到代码:
    • 编写/设计/实现功能
  • 代码到代码:
    • 代码语言转换
  • 文本到文本:
    • 解释技术概念
  • 通用问答:
    • 自我介绍
    • 目的说明

工作范围

  • 限制: 对于通用问题,模型可能不输出相关答案。
  • 建议: 对于代码请求的输出,应进行后处理后再测试。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作