Agile Scrum Sprint Velocity DataSet

github2024-05-20 更新2024-05-31 收录

下载链接：

https://github.com/RandulaKoralage/AgileScrumSprintVelocityDataSet

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含四个开源项目的sprint velocity数据和story point数据，用于2020年的毕业设计项目。每个项目的数据以CSV格式存储，包括问题、问题摘要和sprint数据。数据集强调了数据的预处理需求和已进行的清理工作。

This dataset encompasses sprint velocity and story point data from four open-source projects, utilized for a graduation design project in 2020. The data for each project is stored in CSV format, including issues, issue summaries, and sprint data. The dataset highlights the preprocessing requirements and the cleanup efforts that have been undertaken.

创建时间：

2020-08-18

原始信息汇总

Agile Scrum Sprint Velocity DataSet 概述

数据集来源

项目名称: Spring XD, Meso, Aurora, UserGrid
Board ID: 43, 62, 37, 23
Base URL:
- Spring XD: https://jira.spring.io
- Meso, Aurora, UserGrid: https://issues.apache.org/jira

数据集结构

文件类型: CSV
文件内容:
- X Issues n.csv
- X Issues summary n.csv
- X Sprints n.csv
说明:
- X代表项目名称
- n代表数据集中的行数

数据处理

预处理: 数据应在使用前进行预处理
清理: 新行、制表符和逗号已从字符串中移除
数据筛选: 不适当的数据已被移除
开发者数量计算: 通过计算sprint中的指派人数来确定团队中的开发者数量

数据集使用API

JIRA REST API: 版本7.6.1
Greenhopper API

搜集汇总

数据集介绍

构建方式

该数据集的构建基于Agile Scrum方法论，具体收集了四个开源项目的Scrum冲刺速度数据。数据来源于JIRA REST API和Greenhopper API，涵盖了Spring XD、Meso、Aurora和UserGrid四个项目的相关信息。每个项目的数据被组织为三个CSV文件，分别记录了问题详情、问题摘要和冲刺信息。数据清理过程中，去除了字符串中的换行符、制表符和逗号，并根据每个冲刺中的指派人数确定了开发团队规模。此外，部分不适当的数据也被移除，确保了数据的质量和可用性。

使用方法

使用该数据集时，用户首先需要下载相关CSV文件，并根据项目需求进行数据预处理。数据集中的信息可以用于分析不同项目的冲刺速度、团队效率以及任务分配情况。通过整合JIRA和Greenhopper API的数据，用户可以深入研究Agile Scrum方法论在实际项目中的应用效果。建议用户在使用前详细阅读数据集的README文件，以确保正确理解和处理数据。

背景与挑战

背景概述

在敏捷开发领域，Scrum方法论因其灵活性和高效性而被广泛采用。Agile Scrum Sprint Velocity DataSet由Randula Koralage于2020年创建，作为其毕业设计的一部分。该数据集汇集了四个开源项目的Scrum冲刺数据，包括Spring XD、Meso、Aurora和UserGrid，通过JIRA REST API和Greenhopper API获取。这些数据涵盖了每个项目的冲刺详情、问题列表及摘要，旨在为研究敏捷开发中的冲刺速度提供实证数据支持，进而推动相关领域的理论与实践发展。

当前挑战

该数据集在构建过程中面临多项挑战。首先，数据来源于多个开源项目，确保数据的统一性和完整性是一个复杂的过程。其次，原始数据中包含不规范的字符和格式问题，如换行符、制表符和逗号，需进行预处理以确保数据质量。此外，确定每个冲刺中的开发者数量依赖于分配者的计数，这一方法可能存在误差。最后，数据集的使用需要进一步的预处理，以适应不同的分析需求，这增加了数据处理的复杂性。

常用场景

经典使用场景

Agile Scrum Sprint Velocity DataSet 在敏捷开发领域中，主要用于分析和优化Scrum团队的冲刺速度（Sprint Velocity）。通过该数据集，研究者和实践者能够深入探讨不同开源项目在不同冲刺周期内的任务完成情况，从而为团队提供关于工作负荷、资源分配和项目进度的量化分析。

解决学术问题

该数据集解决了敏捷开发研究中关于团队生产力和项目管理效率的量化问题。通过分析不同项目在不同冲刺中的任务完成情况，研究者可以探讨团队规模、任务复杂度与冲刺速度之间的关系，为敏捷方法论的理论研究提供了实证数据支持，进一步推动了敏捷开发在学术界的研究深度。

实际应用

在实际应用中，Agile Scrum Sprint Velocity DataSet 被广泛用于企业内部的敏捷项目管理优化。通过分析历史冲刺数据，团队可以预测未来的工作负荷，优化资源分配，并调整冲刺计划，从而提高项目交付的效率和质量。此外，该数据集还可用于培训和教育，帮助敏捷教练和项目经理更好地理解和应用Scrum方法。

数据集最近研究