five

ANDROR2

收藏
arXiv2021-06-16 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.4646313 https://github.com/SageSELab/AndroR2
下载链接
链接失效反馈
官方服务:
资源简介:
ANDROR2是由明尼苏达大学、英属哥伦比亚大学和乔治梅森大学联合创建的数据集,包含90个手动复现的Android应用Bug报告。数据集通过深入分析GitHub问题追踪系统中的459个报告收集而来,每个报告包括原始Bug报告、有问题的应用版本apk文件、可执行的复现脚本及复现步骤的质量元数据。ANDROR2旨在支持自动化分析、理解和复现移动应用Bug的研究,广泛应用于软件维护活动。

ANDROR2 is a dataset jointly developed by the University of Minnesota, the University of British Columbia, and George Mason University. It contains 90 manually reproduced Android application bug reports. The dataset is collected through in-depth analysis of 459 reports sourced from GitHub’s issue tracking system. Each included report features the original bug report, the APK file of the problematic application version, executable reproduction scripts, and quality metadata pertaining to the reproduction steps. ANDROR2 is designed to support research on automated analysis, understanding, and reproduction of mobile application bugs, and has been widely utilized in software maintenance activities.
提供机构:
明尼苏达大学, 美国明尼苏达州; 英属哥伦比亚大学, 加拿大不列颠哥伦比亚省; 乔治梅森大学, 美国弗吉尼亚州
创建时间:
2021-06-16
搜集汇总
数据集介绍
main_image_url
构建方式
在Android应用维护领域,构建高质量的数据集对于推动自动化缺陷管理研究至关重要。ANDROR2数据集的构建采用了系统化的方法,首先通过GitHub REST API从2016年至2020年间收集了82,455个标记为“bug”的Java仓库问题。随后,通过多阶段筛选流程,包括检查应用是否在Google Play商店上架、报告是否包含步骤描述、报告者是否为非贡献者、问题是否已关闭,并限制每个仓库最多选取十个报告,最终得到459个候选缺陷报告。在最终阶段,研究团队通过手动复现,使用Pixel 2模拟器并遵循原始步骤描述,成功验证了90个可复现的缺陷,并生成了相应的APK文件、复现脚本及元数据,整个过程耗时约六个月。
特点
ANDROR2数据集在移动应用缺陷研究领域展现出独特价值。其核心特点在于涵盖了多样化的缺陷类型,包括23个崩溃性缺陷和67个非崩溃性缺陷,突破了以往数据集仅关注崩溃问题的局限。数据集提供了丰富的元数据,详细记录了步骤描述的质量、缺失信息以及环境约束,为缺陷报告质量评估提供了坚实基础。此外,所有缺陷均经过至少两名研究者的手动复实验证,确保了可靠性和可复现性,并附带了基于UIAutomator的可执行复现脚本,支持自动化测试与分析。
使用方法
该数据集为自动化缺陷管理研究提供了重要基准。研究者可利用ANDROR2评估缺陷报告自动分析、复现及定位技术的有效性,例如通过比较自动生成脚本与数据集中手动创建的“基准”脚本的步骤数量。数据集中的元数据可用于缺陷报告优先级排序研究,基于步骤描述质量进行分类。此外,它还可作为目标应用探索、动态程序切片及缺陷定位技术的测试平台,通过将数据集中的故障设为分析目标,验证方法的准确性和效率。数据集可通过Zenodo和GitHub公开获取,包含缺陷报告、元数据、APK文件和复现脚本,便于直接集成到研究流程中。
背景与挑战
背景概述
在移动应用日益普及的背景下,软件维护活动占据了开发周期的主要部分,其中缺陷报告的复现与理解成为关键环节。ANDROR2数据集由明尼苏达大学、英属哥伦比亚大学及乔治梅森大学的研究团队于2021年共同构建,旨在为Android应用缺陷管理研究提供基准。该数据集通过系统化方法从GitHub问题跟踪器中筛选并手动复现了90个真实缺陷报告,涵盖崩溃与非崩溃性故障类型,并包含原始报告、缺陷版本APK文件、可执行复现脚本及元数据。其核心研究问题聚焦于自动化缺陷报告分析、复现与定位,为移动应用软件测试与维护领域提供了高质量、可复现的数据支持,推动了相关自动化工具的发展与评估。
当前挑战
ANDROR2数据集致力于解决Android应用缺陷报告自动化处理中的核心挑战,包括缺陷报告质量参差不齐、复现步骤缺失或模糊、以及跨设备与环境配置的兼容性问题。在构建过程中,研究团队面临多重困难:首先,从海量GitHub问题中筛选出非贡献者提交的、包含复现步骤的有效缺陷报告需克服数据噪声与信息不完整的障碍;其次,手动复现缺陷时需将自然语言描述的步骤映射为GUI操作,并处理APK文件构建失败、外部设备依赖、账户权限限制等实际问题;此外,确保复现过程的一致性与可靠性要求多名研究者交叉验证,耗费约六个月人月工作量,凸显了高质量数据集创建的复杂性与资源密集性。
常用场景
经典使用场景
在移动应用软件工程领域,ANDROR2数据集为自动化缺陷报告分析提供了关键基准。该数据集通过系统化收集并人工复现了90个真实Android应用缺陷报告,涵盖了崩溃与非崩溃两类故障类型。研究者可利用其包含的原始缺陷描述、可执行APK文件及复现脚本,构建和验证自动化缺陷理解与复现算法。数据集特别注重缺陷复现步骤的质量标注,为评估自动化工具在解析自然语言描述并映射到GUI操作序列方面的性能提供了标准化测试平台。
衍生相关工作
基于ANDROR2数据集已衍生出多个重要研究方向。在缺陷报告自动化处理方面,研究者利用其构建了更精确的复现步骤到GUI操作映射模型。软件测试领域将其作为目标导向应用探索技术的评估基准,验证测试生成方法能否抵达特定缺陷场景。动态程序切片与缺陷定位技术通过数据集中已验证的故障点评估其精度与效率。新兴的视频缺陷报告分析工作则使用数据集的执行脚本作为标准场景,评估视频到可执行测试用例的转换能力。
数据集最近研究
最新研究方向
在移动应用软件维护领域,ANDROR2数据集为自动化缺陷报告管理研究提供了关键基准。该数据集通过系统化收集与手动复现Android应用的真实缺陷报告,推动了缺陷报告质量评估与自动复现技术的前沿探索。当前研究聚焦于利用自然语言处理与程序分析技术,将用户提交的缺陷描述转化为可执行的GUI操作序列,以提升缺陷定位与修复效率。同时,数据集涵盖崩溃与非崩溃类缺陷的多样性,支持动态切片、故障定位及测试用例生成等研究方向,为移动应用软件测试与维护的自动化工具开发提供了实证基础。
相关研究论文
  • 1
    AndroR2: A Dataset of Manually Reproduced Bug Reports for Android Applications明尼苏达大学, 美国明尼苏达州; 英属哥伦比亚大学, 加拿大不列颠哥伦比亚省; 乔治梅森大学, 美国弗吉尼亚州 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作