Agile Scrum Sprint Velocity DataSet
收藏github2024-05-20 更新2024-05-31 收录
下载链接:
https://github.com/RandulaKoralage/AgileScrumSprintVelocityDataSet
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个开源项目的sprint velocity数据和story point数据,用于2020年的毕业设计项目。每个项目的数据以CSV格式存储,包括问题、问题摘要和sprint数据。数据集强调了数据的预处理需求和已进行的清理工作。
This dataset encompasses sprint velocity and story point data from four open-source projects, utilized for a graduation design project in 2020. The data for each project is stored in CSV format, including issues, issue summaries, and sprint data. The dataset highlights the preprocessing requirements and the cleanup efforts that have been undertaken.
创建时间:
2020-08-18
原始信息汇总
Agile Scrum Sprint Velocity DataSet 概述
数据集来源
- 项目名称: Spring XD, Meso, Aurora, UserGrid
- Board ID: 43, 62, 37, 23
- Base URL:
- Spring XD: https://jira.spring.io
- Meso, Aurora, UserGrid: https://issues.apache.org/jira
数据集结构
- 文件类型: CSV
- 文件内容:
- X Issues n.csv
- X Issues summary n.csv
- X Sprints n.csv
- 说明:
- X代表项目名称
- n代表数据集中的行数
数据处理
- 预处理: 数据应在使用前进行预处理
- 清理: 新行、制表符和逗号已从字符串中移除
- 数据筛选: 不适当的数据已被移除
- 开发者数量计算: 通过计算sprint中的指派人数来确定团队中的开发者数量
数据集使用API
- JIRA REST API: 版本7.6.1
- Greenhopper API
搜集汇总
数据集介绍

构建方式
该数据集的构建基于Agile Scrum方法论,具体收集了四个开源项目的Scrum冲刺速度数据。数据来源于JIRA REST API和Greenhopper API,涵盖了Spring XD、Meso、Aurora和UserGrid四个项目的相关信息。每个项目的数据被组织为三个CSV文件,分别记录了问题详情、问题摘要和冲刺信息。数据清理过程中,去除了字符串中的换行符、制表符和逗号,并根据每个冲刺中的指派人数确定了开发团队规模。此外,部分不适当的数据也被移除,确保了数据的质量和可用性。
使用方法
使用该数据集时,用户首先需要下载相关CSV文件,并根据项目需求进行数据预处理。数据集中的信息可以用于分析不同项目的冲刺速度、团队效率以及任务分配情况。通过整合JIRA和Greenhopper API的数据,用户可以深入研究Agile Scrum方法论在实际项目中的应用效果。建议用户在使用前详细阅读数据集的README文件,以确保正确理解和处理数据。
背景与挑战
背景概述
在敏捷开发领域,Scrum方法论因其灵活性和高效性而被广泛采用。Agile Scrum Sprint Velocity DataSet由Randula Koralage于2020年创建,作为其毕业设计的一部分。该数据集汇集了四个开源项目的Scrum冲刺数据,包括Spring XD、Meso、Aurora和UserGrid,通过JIRA REST API和Greenhopper API获取。这些数据涵盖了每个项目的冲刺详情、问题列表及摘要,旨在为研究敏捷开发中的冲刺速度提供实证数据支持,进而推动相关领域的理论与实践发展。
当前挑战
该数据集在构建过程中面临多项挑战。首先,数据来源于多个开源项目,确保数据的统一性和完整性是一个复杂的过程。其次,原始数据中包含不规范的字符和格式问题,如换行符、制表符和逗号,需进行预处理以确保数据质量。此外,确定每个冲刺中的开发者数量依赖于分配者的计数,这一方法可能存在误差。最后,数据集的使用需要进一步的预处理,以适应不同的分析需求,这增加了数据处理的复杂性。
常用场景
经典使用场景
Agile Scrum Sprint Velocity DataSet 在敏捷开发领域中,主要用于分析和优化Scrum团队的冲刺速度(Sprint Velocity)。通过该数据集,研究者和实践者能够深入探讨不同开源项目在不同冲刺周期内的任务完成情况,从而为团队提供关于工作负荷、资源分配和项目进度的量化分析。
解决学术问题
该数据集解决了敏捷开发研究中关于团队生产力和项目管理效率的量化问题。通过分析不同项目在不同冲刺中的任务完成情况,研究者可以探讨团队规模、任务复杂度与冲刺速度之间的关系,为敏捷方法论的理论研究提供了实证数据支持,进一步推动了敏捷开发在学术界的研究深度。
实际应用
在实际应用中,Agile Scrum Sprint Velocity DataSet 被广泛用于企业内部的敏捷项目管理优化。通过分析历史冲刺数据,团队可以预测未来的工作负荷,优化资源分配,并调整冲刺计划,从而提高项目交付的效率和质量。此外,该数据集还可用于培训和教育,帮助敏捷教练和项目经理更好地理解和应用Scrum方法。
数据集最近研究
最新研究方向
在敏捷开发领域,Scrum方法论的应用日益广泛,而Agile Scrum Sprint Velocity DataSet的推出为研究团队提供了宝贵的数据资源。该数据集聚焦于开源项目的迭代速度,涵盖了Spring XD、Meso、Aurora和UserGrid等项目,通过JIRA REST API和Greenhopper API采集数据,详细记录了每个冲刺周期内的任务分配、开发人员数量及任务完成情况。这一数据集的独特之处在于其对团队协作效率的量化分析,为研究敏捷开发中的团队动态、任务分配优化以及迭代速度提升提供了新的视角。当前,该数据集的研究方向主要集中在通过数据驱动的决策支持系统,优化Scrum流程中的资源配置和任务优先级排序,从而提升开发效率和项目交付质量。
以上内容由遇见数据集搜集并总结生成



