five

Automated Unit Test Generation via Chain of Thought Prompt and Reinforcement Learning

收藏
DataCite Commons2025-06-01 更新2025-05-07 收录
下载链接:
https://figshare.com/articles/dataset/Automated_Unit_Test_Generation_via_Chain_of_Thought_Prompt_and_Reinforcement_Learning/28235750/1
下载链接
链接失效反馈
官方服务:
资源简介:
IntroductionThis is the replication package for the paper "Automated Unit Test Generation via Chain of Thought Prompt and Reinforcement Learning".Organization of the Replication Package<b>checkpoints.zip:</b> fine-tuned models, including TestCTRL, TestCT, TestCT-no-cot, TestCT-intention, TestCT-input, TestCT-ti, CodeBERT-line, CodeT5-line, CodeGPT-line, CodeBERT-branch, CodeT5-branch, and CodeGPT-branch.<b>dataset.zip</b>: Datasets for fine-tuning and reinforcement learning, including the CoT dataset, reward dataset (reward folder), and the dataset for PPO optimization (rl folder).<b>evaluation.zip:</b> scripts for evaluating the generated tests, including CodeBLEU, syntactic correct rate, compilation passing rate, line coverage rate, and branch coverage rate.<b>finetune.zip: </b>scripts and configs for fine-tuning large language models for test generation.<b>generated_test_result.zip:</b> the generated tests.<b>pretrain.zip:</b> pre-trained models, including CodeLlama, CodeBERT, CodeT5, and CodeBERT.<b>CoT_quality.zip: </b>the example of evaluating CoT prompts.

引言 本数据包为论文《基于思维链提示与强化学习的自动化单元测试生成》的复现套件。 复现套件组织结构 <b>checkpoints.zip:</b> 存放微调后的模型,涵盖TestCTRL、TestCT、TestCT-no-cot、TestCT-intention、TestCT-input、TestCT-ti、CodeBERT-line、CodeT5-line、CodeGPT-line、CodeBERT-branch、CodeT5-branch与CodeGPT-branch。 <b>dataset.zip:</b> 包含用于微调与强化学习的数据集,具体包括思维链(Chain of Thought)数据集、奖励数据集(位于reward文件夹下)以及用于PPO优化的数据集(位于rl文件夹下)。 <b>evaluation.zip:</b> 收录用于评估生成测试用例的脚本,涵盖代码BLEU(CodeBLEU)得分、语法正确率、编译通过率、行覆盖率与分支覆盖率。 <b>finetune.zip:</b> 包含用于微调大语言模型以生成测试用例的脚本与配置文件。 <b>generated_test_result.zip:</b> 存放生成的测试用例。 <b>pretrain.zip:</b> 收录预训练模型,包含CodeLlama、CodeBERT、CodeT5以及CodeBERT。 <b>CoT_quality.zip:</b> 包含思维链提示的评估示例。
提供机构:
figshare
创建时间:
2025-01-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个复现包,包含用于测试生成的fine-tuned模型、数据集和评估脚本,支持通过链式思维提示和强化学习进行自动化单元测试生成的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作