QURE
收藏arXiv2025-08-12 更新2025-08-14 收录
下载链接:
https://doi.org/10.5281/zenodo.15656471
下载链接
链接失效反馈官方服务:
资源简介:
QURE数据集是一组包含2111条工业需求的全新数据集,这些需求已通过现实世界的审查过程进行注释。该数据集此前作为工业合同的一部分使用了五年,现在被公开发布给研究社区。除了发布数据集外,我们还提供了数据集的描述性统计信息,包括词汇多样性和可读性等度量,并将其与现有的需求数据集和合成生成的要求进行了比较。与合成数据集相比,QURE在语言学上与现有的数据集相似。然而,该数据集附带详细的上下文描述,其标签在一个接近十年的工业环境中系统地创建和使用。我们的目标是促进透明度、可比性和经验严谨性,通过支持为需求质量数据集开发一个共同的黄金标准。这将反过来使该领域的更可靠和协作的研究努力成为可能。
The QURE dataset is a novel collection containing 2111 industrial requirements, which have been annotated via a real-world review process. This dataset was utilized as part of an industrial contract for five years prior to its public release to the research community. In addition to releasing the dataset, we also provide descriptive statistics for it, including metrics such as lexical diversity and readability, and compare it against existing requirement datasets and synthetically generated requirements. Compared with synthetic datasets, QURE is linguistically similar to existing datasets. However, this dataset is accompanied by detailed contextual descriptions, and its labels were systematically created and utilized within an industrial environment spanning nearly a decade. Our goal is to advance transparency, comparability, and empirical rigor by supporting the development of a common gold standard for requirement quality datasets. This will in turn enable more robust and collaborative research efforts within this field.
提供机构:
Mercedes-Benz AG
创建时间:
2025-08-12
搜集汇总
数据集介绍

构建方式
QURE数据集构建于真实的汽车行业需求文档,涵盖2,111条经过工业级评审流程标注的自然语言需求。其核心语料源自梅赛德斯-奔驰五年间实际使用的规格说明书,通过多阶段严谨处理:首先由领域专家基于103个弱词目录筛选出10万条候选需求;继而采用三专家背靠背标注机制,对含有弱词的需求进行缺陷评估;最终经过匿名化处理和模糊样本剔除,确保数据兼具工业真实性与研究适用性。该数据集独特之处在于其标注结果曾作为服务等级协议(SLA)的质量基准,历经五年生产环境验证。
使用方法
该数据集以CSV格式提供四维结构化数据:需求ID、原始文本、弱词标签及缺陷标记。研究者可重点应用于三大场景:作为机器学习模型的训练集,开发需求质量自动检测工具;作为基准测试集,评估不同质量检测算法的性能;或作为语料库,开展需求语言学特征的实证研究。使用时应特别注意其行业特异性——数据反映德国汽车行业的写作规范,且缺陷密度(30%)高于常规需求文档。建议结合配套发布的标注指南和需求成熟度元数据进行分析,必要时可与其他领域数据集进行对比研究以验证结论的普适性。
背景与挑战
背景概述
QURE(Quality in Requirements)数据集由Henning Femmer、Frank Houdek、Max Unterbusch和Andreas Vogelsang等研究人员于2025年发布,旨在解决自然语言需求(NL)质量缺陷的实证研究问题。该数据集包含2,111条来自梅赛德斯-奔驰汽车项目的工业需求,每条需求均通过真实工业评审流程标注了质量缺陷标签。QURE是目前该领域最大的公开数据集之一,其标注过程历时近十年,并在工业合同中被广泛使用,确保了数据的真实性和代表性。该数据集的发布为需求质量评估工具的基准测试、机器学习模型训练以及复现研究提供了重要支持,显著提升了需求工程领域的透明度和实证研究水平。
当前挑战
QURE数据集面临的挑战主要包括两方面:领域问题的挑战和构建过程的挑战。在领域问题方面,需求质量缺陷(如模糊性、不一致性和不完整性)的检测与修复一直是软件工程中的核心难题,而现有数据集往往规模小、标注标准不统一或缺乏工业背景,限制了研究的可比性和可推广性。QURE通过提供大规模、工业级标注数据部分解决了这一问题,但其标注仅聚焦于“弱词”类词汇缺陷,未涵盖句法或语义层面的其他缺陷类型。在构建过程中,挑战包括数据匿名化处理(需移除敏感信息)、标注一致性保障(依赖多名专家协商),以及样本偏差问题(数据集缺陷密度高于实际项目需求分布)。这些挑战为后续研究提供了改进方向,例如扩展缺陷类型覆盖或开发更普适的标注框架。
常用场景
经典使用场景
QURE数据集作为工业级自然语言需求质量分析的基准工具,其最经典的使用场景在于支持需求工程领域的实证研究。数据集包含2,111条来自汽车行业的真实需求文本,每条都标注了弱词缺陷标签,为研究人员提供了分析需求文档中语言缺陷模式的标准化素材。特别是在需求气味检测、自动化质量评估工具开发等方向,该数据集通过其工业背景的标注数据,能够有效验证检测算法的准确性和实用性。
解决学术问题
该数据集主要解决了需求质量研究中数据稀缺性和代表性问题。传统研究常受限于小规模样本或合成数据的局限性,而QURE通过提供大规模真实工业需求文本及经过多专家验证的缺陷标签,建立了可复用的研究基准。其标注体系聚焦于弱词引发的语义模糊问题,为需求可读性、精确性等语言学维度的量化研究提供了数据支撑,显著提升了需求缺陷检测领域研究的实证严谨性。
实际应用
在工业实践中,QURE数据集可直接应用于企业需求评审流程的优化。基于该数据集训练的自动化检测工具能够识别需求文档中的潜在弱词,帮助工程师在早期发现表述模糊、易引发歧义的条款。梅赛德斯-奔驰公司曾将其作为服务等级协议(SLA)的基准测试集,持续五年用于监控合作方的质量分析工具性能,证明了其在工业质量控制体系中的实用价值。
数据集最近研究
最新研究方向
随着自然语言处理技术在软件工程领域的深入应用,QURE数据集的发布为需求质量研究开辟了新的前沿方向。该数据集以其工业级标注标准和真实场景下的需求样本,为基于机器学习的需求缺陷检测模型提供了重要训练资源。当前研究热点集中在三个方面:一是探索大语言模型在需求质量评估中的迁移学习能力,通过QURE的标注数据微调预训练模型;二是构建多维度质量评估体系,将传统语言学指标与新兴的语义理解技术相结合;三是建立跨领域的需求质量基准测试平台,利用QURE的工业背景验证不同方法的泛化性能。这些研究方向不仅推动了需求工程领域的实证研究范式转型,也为解决软件开发中需求缺陷导致的成本溢出问题提供了数据基础。
相关研究论文
- 1Description and Comparative Analysis of QuRE: A New Industrial Requirements Quality DatasetMercedes-Benz AG · 2025年
以上内容由遇见数据集搜集并总结生成



