five

MoveMethodDataset

收藏
github2020-07-06 更新2024-05-31 收录
下载链接:
https://github.com/ml-in-programming/MoveMethodDataset
下载链接
链接失效反馈
官方服务:
资源简介:
用于评估移动方法推荐算法的数据集。

A dataset for evaluating mobile method recommendation algorithms.
创建时间:
2019-03-14
原始信息汇总

数据集概述

数据集目的

用于评估Move Method推荐算法的性能。

数据集结构

  • <project_name>:主文件夹,包含项目所有相关数据。
    • <project_name>:git子模块,链接到实际的代码仓库。
    • patches:包含用于实际移动方法的补丁文件夹。
    • *.csv:描述移动方法重构数据的文件。
    • log:记录工具生成可能重定位的日志。

附加工具

  • print_statistics.py:Python脚本,用于输出数据集的统计信息,如移动的方法数量。
搜集汇总
数据集介绍
main_image_url
构建方式
MoveMethodDataset的构建基于对代码库中方法移动(Move Method)重构的深入分析。数据集通过收集多个开源项目的代码库,利用自动化工具生成可能的方法移动建议,并通过补丁文件的形式记录这些重构操作。每个项目的数据以CSV文件形式存储,详细描述了方法移动的具体信息,包括源类和目标类等关键数据。此外,日志文件记录了工具生成建议的过程,确保了数据的可追溯性和透明性。
特点
MoveMethodDataset的特点在于其专注于方法移动重构的评估,为研究者和开发者提供了一个标准化的基准。数据集涵盖了多个开源项目,确保了数据的多样性和代表性。每个项目的数据结构清晰,包含补丁文件、CSV文件和日志文件,便于用户深入分析。此外,数据集还提供了统计脚本,帮助用户快速了解数据集的规模和方法移动的分布情况。
使用方法
使用MoveMethodDataset时,用户可以通过加载CSV文件获取方法移动的具体信息,并结合补丁文件进行实际代码重构的验证。日志文件可用于分析工具生成建议的准确性和效率。数据集附带的Python脚本`print_statistics.py`可用于生成数据集的统计信息,帮助用户快速了解数据集的整体情况。用户还可以通过Git子模块访问原始代码库,进一步验证和扩展数据集的应用场景。
背景与挑战
背景概述
MoveMethodDataset是一个专门用于评估方法迁移推荐算法的数据集,旨在解决软件开发中代码重构的关键问题。该数据集由ml-in-programming团队创建,主要研究人员通过分析大量开源项目中的代码变更,构建了一个包含方法迁移信息的结构化数据集。数据集的核心研究问题在于如何通过自动化工具推荐最佳的方法迁移方案,以提高代码的可维护性和可读性。自发布以来,MoveMethodDataset在软件工程领域引起了广泛关注,为代码重构研究提供了重要的数据支持,推动了自动化重构工具的发展。
当前挑战
MoveMethodDataset面临的挑战主要集中在两个方面。其一,方法迁移推荐算法的评估需要高质量的真实数据,而数据集中方法迁移的多样性和复杂性对算法的泛化能力提出了较高要求。其二,数据集的构建过程中,研究人员需要从大量开源项目中提取有效的方法迁移信息,并确保数据的准确性和一致性,这一过程涉及复杂的代码分析和数据清洗工作。此外,如何将方法迁移的上下文信息(如类关系、方法调用链)纳入数据集,以支持更精准的推荐,也是当前亟待解决的难题。
常用场景
经典使用场景
MoveMethodDataset数据集在软件工程领域中被广泛用于评估和优化方法迁移推荐算法。通过提供详细的方法迁移数据,该数据集为研究人员提供了一个标准化的测试平台,用于验证和比较不同算法在识别和推荐方法迁移时的性能。
解决学术问题
该数据集解决了软件重构中方法迁移推荐算法的评估难题。通过提供真实项目中的方法迁移案例,研究人员能够深入分析不同算法的准确性和效率,从而推动软件重构技术的进步。
衍生相关工作
基于MoveMethodDataset,研究人员开发了多种方法迁移推荐算法,并在国际顶级会议上发表了相关论文。这些工作不仅丰富了软件重构领域的研究成果,还为未来的算法优化提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作