Arain/UnitTest-Finetuning
收藏Hugging Face2024-04-15 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/Arain/UnitTest-Finetuning
下载链接
链接失效反馈官方服务:
资源简介:
UnitTest-Finetuning Corpus数据集包含148万个指令提示,用于敏捷开发(AD)和测试驱动开发(TDD)中的开发任务,涵盖了约5.5K个Java和16.2K个Python开源项目。数据集支持多种任务,包括测试完成、测试生成和功能代码生成。每个数据点代表一个指令提示,包含了具体的指令和输出。数据集的结构和提示类型也被详细描述,包括测试完成、测试生成和功能代码生成的具体指令格式。
提供机构:
Arain
原始信息汇总
UnitTest-Finetuning Corpus 数据集概述
数据集概要
- 名称: UnitTest-Finetuning Corpus
- 规模: 包含约1.48百万个指令提示,涵盖约5.5K Java和16.2K Python开源项目。
- 用途: 主要用于敏捷开发(AD)和测试驱动开发(TDD)中的开发任务。
支持的任务
-
Method-Test Dataset:
- 用途: 用于训练模型完成测试完成和测试生成任务。
- 应用场景: 敏捷开发。
-
Docstring-Test-Method Dataset:
- 用途: 用于训练模型完成测试完成、测试生成任务及功能代码生成。
- 应用场景: 测试驱动开发。
语言
- Java
- Python
数据集结构
数据实例
- 描述: 每个数据点代表一个指令提示。
- 示例: json { "instruction": "You are a professional java software engineer...", "output": "java package com.google.api.client.util.escape;..." }
提示类型
- Test Completion in AD: 用于生成新的测试方法以覆盖未测试的方面。
- Test Generation in AD: 用于生成完整的测试类。
- Test Completion in TDD: 用于生成新的测试方法以覆盖未测试的方面。
- Test Generation in TDD: 用于从自然语言需求中生成完整的测试类。
- Functional Code Generation in TDD: 用于生成确保所有测试通过的功能代码。
许可证
- 类型: Apache-2.0



