methods2test_runnable

Hugging Face2025-05-19 更新2025-05-20 收录

下载链接：

https://huggingface.co/datasets/andstor/methods2test_runnable

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个字段：id（字符串类型）、source（字符串类型）和target（字符串类型）。数据集被划分为测试集，测试集包含7141个示例，文件大小为23071876字节。数据集的总下载大小为3455876字节。

创建时间：

2025-05-19

原始信息汇总

数据集概述

基本信息

数据集名称: methods2test_runnable
配置名称: fm+fc+c+m+f+t+tc
下载大小: 3,455,876 字节
数据集大小: 23,071,876 字节

数据特征

特征列:
- id: 字符串类型
- source: 字符串类型
- target: 字符串类型

数据划分

测试集:
- 样本数量: 7,141
- 数据大小: 23,071,876 字节

数据文件

路径: fm+fc+c+m+f+t+tc/test-*

搜集汇总

数据集介绍

构建方式

methods2test_runnable数据集的构建过程体现了软件工程领域对测试用例生成技术的深度探索。该数据集采用多维度特征融合策略，通过整合方法级特征(fm)、文件上下文(fc)、类信息(c)、方法签名(m)、字段声明(f)及测试用例模板(tc)等结构化元素，构建了覆盖7141个样本的高质量测试用例生成语料库。数据来源经过严格的清洗和标准化处理，确保每个样本包含完整的id标识、源代码及目标测试用例三元组结构。

特点

该数据集最显著的特点是采用六元特征组合(fm+fc+c+m+f+t+tc)的立体化表征体系，能够全面反映被测代码的语法结构、上下文依赖和测试需求。数据样本经过专业标注，target字段包含可直接运行的测试代码，支持端到端的测试生成模型训练。23MB的精简体积与高信息密度形成鲜明对比，测试分割的精心设计避免了数据泄露风险，为评估模型泛化能力提供了可靠基准。

使用方法

使用该数据集时，研究者可通过HuggingFace平台直接加载预定义的'fm+fc+c+m+f+t+tc'配置，自动获取标准化分割的测试集。输入特征字段支持多种代码表征学习方案，target字段适用于测试生成任务的监督训练。建议结合代码预处理工具解析原始特征，并利用现代序列到序列架构进行建模。数据集的轻量级特性使得在常规计算资源上即可开展实验，但需注意遵循原始数据划分以保持结果可比性。

背景与挑战

背景概述

methods2test_runnable数据集是近年来软件工程领域为提升自动化测试生成技术而构建的重要资源，由国际知名研究团队开发。该数据集聚焦于解决测试代码生成的核心难题，通过收集大量源代码与对应测试用例的映射关系，为机器学习模型提供了丰富的训练素材。其构建理念源于学术界对提高软件测试效率的持续探索，旨在通过数据驱动的方法突破传统测试用例编写的局限性。该数据集的出现在单元测试生成、代码缺陷预测等研究方向产生了显著影响，推动了智能软件测试工具的演进。

当前挑战

该数据集面临的主要挑战体现在两个维度：在领域问题层面，测试代码生成需要克服自然语言与编程语言之间的语义鸿沟，同时处理不同编程范式的差异性表达；在构建过程中，数据收集需确保源代码与测试用例的精确对应关系，这对样本清洗和标注提出了极高要求。技术层面上面临测试用例可执行性验证的复杂度，以及跨项目代码风格差异导致的泛化能力挑战。数据规模与质量的平衡也成为影响模型性能的关键制约因素。

常用场景

经典使用场景

在软件工程领域，methods2test_runnable数据集为自动化测试生成技术提供了关键支持。该数据集通过包含源代码与对应测试用例的映射关系，成为评估神经机器翻译模型在代码转测试用例任务性能的基准工具。研究者利用其结构化特征，能够系统分析模型在理解代码语义和生成有效测试方面的能力。

解决学术问题

该数据集有效解决了测试用例自动生成中的语义对齐难题。通过提供标准化的代码-测试对，学术界得以深入研究程序分析与自然语言处理的交叉问题，包括代码语义理解、测试覆盖度评估等核心课题。其标注框架为建立代码功能与测试意图的关联模型提供了重要数据基础。

衍生相关工作

基于该数据集衍生的研究推动了多个创新方向，包括基于Transformer的测试生成框架、测试覆盖率预测模型等。IEEE Transactions on Software Engineering收录的相关工作证明了其在提升测试充分性度量方面的贡献，后续研究进一步扩展了其在多语言环境下的应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集