PROMISE exp dataset

Name: PROMISE exp dataset
Creator: 伊斯兰大学技术学院计算机科学与工程系
Published: 2025-10-21 04:45:15
License: 暂无描述

arXiv2025-10-21 更新2025-10-23 收录

下载链接：

https://github.com/refinedev/refine

下载链接

链接失效反馈

官方服务：

资源简介：

PROMISE exp数据集是一个扩展的非功能性需求（NFR）数据集，包含从项目章程和开源软件文档中收集的NFRs，旨在帮助自动化NFR的分类。数据集包括超过968条NFRs，分为多个类别，如可用性、法律、外观和感觉、可维护性、可操作性、性能、可扩展性、安全性、可用性、容错性、可移植性、互操作性、合规性、可靠性和本地化。该数据集通过使用大型语言模型（LLMs）进行分类，并使用多种评估指标进行比较，以提高NFR分类的准确性和效率。

The PROMISE exp dataset is an extended non-functional requirement (NFR) corpus that collects NFR instances from project charters and open-source software documentation, aiming to support automated NFR classification. The dataset comprises over 968 NFR entries, categorized into multiple classes including availability, legality, look and feel, maintainability, operability, performance, scalability, security, availability, fault tolerance, portability, interoperability, compliance, reliability, and localization. To enhance the accuracy and efficiency of NFR classification, this dataset has been classified using large language models (LLMs) and compared across multiple evaluation metrics.

提供机构：

伊斯兰大学技术学院计算机科学与工程系

创建时间：

2025-10-21

原始信息汇总

Refine 数据集概述

数据集基本信息

项目名称: Refine
项目类型: React 元框架
开源状态: 开源项目
许可证: MIT License
主要用途: 企业级 CRUD 密集型 Web 应用程序开发

核心描述

Refine 是一个用于企业级的 React 元框架，为从管理面板到仪表板和内部工具的一切提供无头解决方案。它是低代码/无代码和"从零开始"之间的最佳平衡点，特别适用于 CRUD 密集型应用程序。

主要特性

架构特性

无头架构设计，实现业务逻辑与 UI 和路由的解耦
支持高度定制化应用程序开发
内置行业标准解决方案，涵盖认证、访问控制、路由、网络、状态管理和国际化

技术集成

UI 框架支持: Ant Design、Material UI、Mantine、Chakra UI，以及任何自定义设计或 TailwindCSS
平台支持: Next.js、Remix、React Native、Electron 等
后端服务连接器: 支持 15+ 后端服务，包括 REST API、GraphQL、NestJs CRUD、Airtable、Strapi、Supabase、Hasura、Appwrite 等

功能特性

Refine Devtools 提供应用深度分析和有用洞察
基于 API 数据结构自动生成 CRUD 用户界面
使用 React Query 实现完美的状态管理和变更
无缝认证和访问控制流程提供程序
开箱即用的实时/实时应用程序支持
简单的审计日志和文档版本控制
SSR 支持（Next.js 和 Remix）

适用场景

数据密集型 企业 B2B 应用程序
管理面板
仪表板
内部工具
店面（得益于内置 SSR 支持）

快速开始

使用以下命令在几秒内启动新项目： sh npm create refine-app@latest my-refine-app

学习资源

教程：构建全面 CRUD 应用程序的分步指南
指南与概念：了解基本概念
高级教程：不同使用场景的深入教程

社区与贡献

Discord 社区支持
欢迎贡献者创建插件、协助处理问题和拉取请求
社区驱动项目，持续改进

项目状态

活跃开发维护
拥有完善的文档和示例
活跃的社区支持
定期更新和改进

搜集汇总

数据集介绍

构建方式

在软件工程领域，非功能性需求的精准识别对系统质量保障至关重要。PROMISE exp数据集通过整合项目章程与开源软件文档构建而成，研究团队采用系统化方法从真实项目资料中提取需求描述，经过人工分析与专家验证流程，将原始需求划分为功能性需求与非功能性需求两大类别。该数据集在原有PROMISE NFR数据集基础上进行了显著扩展，新增了兼容性、互操作性、合规性等新兴需求类别，并通过谷歌搜索引擎广泛收集软件需求规格说明书，确保了数据来源的多样性与专业性。

特点

该数据集在非功能性需求分类研究中展现出显著特色，其核心优势在于覆盖了15个细粒度需求类别，包括性能、安全性、可用性等传统维度，以及新引入的本地化、可靠性等现代软件质量属性。数据集规模经过精心设计，包含525条非功能性需求与444条功能性需求，形成了均衡的类别分布。特别值得关注的是，数据集提供了每个需求类别的明确定义与实例说明，这种结构化设计既便于研究人员理解分类标准，又为机器学习模型训练提供了高质量的标注数据，有效支撑了自动化分类任务的开展。

使用方法

该数据集为自然语言处理技术在软件工程领域的应用提供了理想实验平台。研究人员可采用监督学习范式，将需求文本作为输入特征，对应的需求类别作为预测目标，通过构建分类模型实现自动化需求归类。在实际应用中，建议采用80-20的数据划分策略进行模型训练与评估，并综合运用精确率、召回率和F1分数等指标衡量分类性能。值得注意的是，数据集支持基于LIME的可解释性分析，能够深入揭示模型决策依赖的关键词汇，这种特性使得该数据集特别适合用于开发透明可信的智能需求分析系统。

背景与挑战

背景概述

PROMISE exp数据集由Lima等人于2019年创建，作为tera-PROMISE存储库的扩展版本，旨在解决软件工程领域非功能性需求分类的核心研究问题。该数据集由伊斯兰科技大学等机构的研究团队主导开发，通过整合项目章程和开源软件文档，将非功能性需求细分为可用性、安全性、性能等超过15个子类。其构建显著提升了机器学习与深度学习模型在需求工程中的分类精度，为自动化软件质量保障提供了关键数据基础，推动了智能软件工程方法的发展。

当前挑战

在非功能性需求分类领域，该数据集面临语义模糊性与类别重叠的固有挑战，例如性能与可靠性需求常存在交叉，导致模型区分困难。构建过程中，研究人员需克服项目章程非结构化与数据稀疏性问题，部分需求类别样本不足影响了模型泛化能力。此外，手动标注依赖领域专家知识，可能引入主观偏差，而开源文档的完整性缺失进一步加剧了数据质量控制的复杂性。

常用场景

经典使用场景

在软件工程领域，PROMISE exp数据集作为非功能性需求分类研究的基准数据集，其经典应用场景主要体现在自动化需求分析系统的开发与验证。该数据集通过整合项目章程和开源软件文档中的非功能性需求，为研究人员提供了丰富的标注语料，使得各类机器学习模型能够在统一标准下进行性能比较。特别是在大语言模型快速发展的背景下，该数据集成为评估模型在需求工程领域泛化能力的重要试金石，为构建智能软件需求分析工具奠定了数据基础。

实际应用

在实际软件开发过程中，PROMISE exp数据集支撑的需求分类系统能够显著提升项目文档分析效率。企业可利用基于该数据集训练的模型，自动从项目章程和需求文档中提取非功能性需求，辅助架构师进行系统设计决策。特别是在敏捷开发环境中，这种自动化工具能够快速识别关键质量属性需求，确保软件在性能、安全性和可靠性等方面满足用户期望，从而降低项目后期因需求遗漏导致的返工成本。

衍生相关工作

基于PROMISE exp数据集的研究催生了多个经典工作方向的拓展。在模型架构方面，催生了专门针对需求工程优化的预训练模型，如NoRBERT等迁移学习框架的开发。在方法论层面，推动了可解释人工智能技术在需求分析中的应用探索，通过LIME等工具实现模型决策过程的透明化。同时，该数据集还促进了跨项目需求分类的泛化性研究，为构建领域自适应的智能需求分析系统提供了理论支撑和实践验证。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集