five

Arain/UnitTest-Finetuning

收藏
Hugging Face2024-04-15 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/Arain/UnitTest-Finetuning
下载链接
链接失效反馈
官方服务:
资源简介:
UnitTest-Finetuning Corpus数据集包含148万个指令提示,用于敏捷开发(AD)和测试驱动开发(TDD)中的开发任务,涵盖了约5.5K个Java和16.2K个Python开源项目。数据集支持多种任务,包括测试完成、测试生成和功能代码生成。每个数据点代表一个指令提示,包含了具体的指令和输出。数据集的结构和提示类型也被详细描述,包括测试完成、测试生成和功能代码生成的具体指令格式。
提供机构:
Arain
原始信息汇总

UnitTest-Finetuning Corpus 数据集概述

数据集概要

  • 名称: UnitTest-Finetuning Corpus
  • 规模: 包含约1.48百万个指令提示,涵盖约5.5K Java和16.2K Python开源项目。
  • 用途: 主要用于敏捷开发(AD)和测试驱动开发(TDD)中的开发任务。

支持的任务

  1. Method-Test Dataset:

    • 用途: 用于训练模型完成测试完成和测试生成任务。
    • 应用场景: 敏捷开发。
  2. Docstring-Test-Method Dataset:

    • 用途: 用于训练模型完成测试完成、测试生成任务及功能代码生成。
    • 应用场景: 测试驱动开发。

语言

  • Java
  • Python

数据集结构

数据实例

  • 描述: 每个数据点代表一个指令提示。
  • 示例: json { "instruction": "You are a professional java software engineer...", "output": "java package com.google.api.client.util.escape;..." }

提示类型

  • Test Completion in AD: 用于生成新的测试方法以覆盖未测试的方面。
  • Test Generation in AD: 用于生成完整的测试类。
  • Test Completion in TDD: 用于生成新的测试方法以覆盖未测试的方面。
  • Test Generation in TDD: 用于从自然语言需求中生成完整的测试类。
  • Functional Code Generation in TDD: 用于生成确保所有测试通过的功能代码。

许可证

  • 类型: Apache-2.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作