five

TestRoutes

收藏
github2021-06-27 更新2024-05-31 收录
下载链接:
https://github.com/testroutes/manual-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该手动标注的数据集包含了以下开源系统的方法级测试到代码的可追溯性信息:Commons Lang、Joda-Time、JFreeChart和Gson。数据集详细记录了每个系统的版本、Git hash、类、生产方法和测试方法的数量。

This manually annotated dataset contains traceability information from method-level tests to code for the following open-source systems: Commons Lang, Joda-Time, JFreeChart, and Gson. The dataset meticulously records the version, Git hash, classes, and the number of production and test methods for each system.
创建时间:
2019-02-07
原始信息汇总

TestRoutes - A test-to-code traceability dataset

数据集概述

  • 类型: 手动标注数据集
  • 内容: 包含方法级别的测试到代码的可追溯性信息

数据集详情

System Version Git hash Classes Production Methods Test Methods
Commons Lang 3.4 4a26a86 596 4 050 2 473
Joda-Time 2.9.6 909046a 522 6 155 3 779
JFreeChart 1.0.19 b2145a6 953 9 355 2 239
Gson 2.8.0 2271525 757 1 543 924

数据集扩展信息

搜集汇总
数据集介绍
main_image_url
构建方式
TestRoutes数据集通过手动标注的方式构建,专注于开源系统中方法级别的测试到代码的追踪信息。该数据集涵盖了多个知名开源项目,包括Commons Lang、Joda-Time、JFreeChart和Gson等,每个项目的版本、Git哈希值、类数量、生产方法数量以及测试方法数量均被详细记录。数据集的构建过程严格遵循开源项目的版本控制信息,确保了数据的准确性和可追溯性。
特点
TestRoutes数据集的特点在于其高度结构化的信息呈现方式。每个项目的数据均以表格形式展示,包含类、生产方法和测试方法的详细统计信息。此外,数据集还提供了一个更为紧凑的版本,其中包含了可见性及其他修饰符信息,便于研究人员进行深入分析。这种多层次的数据结构为测试与代码之间的追踪研究提供了丰富的素材。
使用方法
TestRoutes数据集的使用方法较为灵活,研究人员可以通过访问GitHub上的项目页面获取完整数据。数据集提供了两种形式的数据表:一种是详细的原始数据表,另一种是经过合并的紧凑版本。用户可以根据研究需求选择合适的数据形式,并通过分析生产方法与测试方法之间的关联,探索测试覆盖率和代码质量之间的关系。此外,数据集还可用于开发自动化测试工具或验证测试追踪算法的有效性。
背景与挑战
背景概述
TestRoutes数据集是一个专注于测试代码与源代码之间追踪关系的手动标注数据集,旨在为软件工程领域的研究提供重要支持。该数据集由研究人员Ali Ghanbari等人创建,涵盖了多个开源系统的版本信息,包括Commons Lang、Joda-Time、JFreeChart和Gson等。通过提供方法级别的测试代码与生产代码的对应关系,TestRoutes为测试用例生成、代码覆盖率分析以及软件维护等研究问题提供了宝贵的数据资源。其创建时间可追溯至相关开源系统的特定版本发布时期,反映了软件工程领域对测试与代码关联性研究的持续关注。
当前挑战
TestRoutes数据集在解决测试代码与源代码追踪关系问题时面临多重挑战。首先,测试代码与生产代码的对应关系往往复杂且隐晦,尤其是在大型开源系统中,手动标注的准确性和一致性难以保证。其次,数据集的构建过程需要处理大量代码文件,涉及代码解析、方法提取以及跨文件关联分析,这对工具链的鲁棒性和效率提出了较高要求。此外,不同开源系统的代码风格和测试框架差异显著,如何统一标注标准并确保数据的通用性也是一大难题。这些挑战不仅影响了数据集的构建质量,也对后续研究的可靠性和可重复性提出了更高要求。
常用场景
经典使用场景
TestRoutes数据集在软件工程领域中被广泛用于测试与代码之间的追踪研究。通过提供方法级别的测试到代码的追踪信息,该数据集为研究人员提供了一个标准化的基准,用于评估和开发新的测试追踪技术。特别是在开源系统的背景下,TestRoutes帮助研究者深入理解测试用例与生产代码之间的复杂关系。
解决学术问题
TestRoutes数据集解决了软件工程中一个长期存在的挑战,即如何有效地追踪测试用例与其对应的生产代码之间的关系。通过提供手动标注的测试到代码的追踪信息,该数据集为研究者提供了一个可靠的基础,用于开发自动化工具和算法,以提高测试覆盖率和代码质量。这一数据集的出现,显著推动了测试追踪领域的研究进展。
衍生相关工作
TestRoutes数据集的发布催生了一系列相关研究,特别是在测试追踪和代码覆盖率分析领域。许多经典工作基于该数据集开发了新的算法和工具,如自动化测试追踪系统和代码覆盖率分析工具。这些工作不仅扩展了数据集的应用范围,还进一步推动了软件工程领域的技术创新和理论发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作