IndusReqFlow

Name: IndusReqFlow
Creator: 华为加拿大研究院
Published: 2026-05-27 01:40:47
License: 暂无描述

arXiv2026-05-27 更新2026-05-28 收录

下载链接：

https://github.com/ZhifeiDou/EdgeFlow-RE2026

下载链接

链接失效反馈

官方服务：

资源简介：

IndusReqFlow是由华为加拿大研究院创建的专有工业流程图数据集，旨在为工业需求工程中的流程图转换研究提供真实世界的数据基准。该数据集包含52个从华为系统级需求文档中收集的流程图，平均每个图含有11.15个节点和11.73条边，数据来源于光网络、数据通信和电动汽车系统等多个工业领域。数据集的构建过程包括由测试工程师独立编写Mermaid代码，并通过对比渲染输出与原始图像进行一致性验证，对于存在分歧的案例通过讨论或专家咨询予以解决。该数据集主要应用于评估和提升基于视觉语言模型的流程图到Mermaid代码的转换性能，旨在解决工业需求文档中静态流程图无法被机器解析的视觉规范鸿沟问题，从而支持基于模型的测试生成和覆盖分析等下游自动化任务。

IndusReqFlow is a proprietary industrial flowchart dataset created by Huawei Canada Research Institute, aiming to provide a real-world data benchmark for flowchart transformation research in industrial requirements engineering. This dataset contains 52 flowcharts collected from Huawei's system-level requirement documents, with each flowchart averaging 11.15 nodes and 11.73 edges. The data originates from multiple industrial sectors including optical networks, data communications, and electric vehicle systems. The dataset construction process involved test engineers independently writing Mermaid code, followed by consistency validation by comparing rendered outputs with the original images. Discrepant cases were resolved through discussions or expert consultations. This dataset is mainly applied to evaluate and improve the performance of visual-language-model-based flowchart-to-Mermaid code transformation, with the goal of addressing the visual specification gap where static flowcharts in industrial requirement documents cannot be parsed by machines, thereby supporting downstream automated tasks such as model-based test generation and coverage analysis.

提供机构：

华为加拿大研究院

创建时间：

2026-05-27

原始信息汇总

数据集概述

该数据集是论文《VLM-based Flowchart Processing with Edge-Map Augmentation: An Industrial RE Study》的复现包，收录于IEEE Requirements Engineering 2026 — Industry Innovation Track。数据集主要用于跨数据集评估（RQ3），包含以下内容：

主要组成部分

图像数据：位于 FlowVQA_Dataset/Images/ 目录下，包含40张采样的FlowVQA流程图图像。
真实标注：位于 FlowVQA_Dataset/Ground_truth/ 目录下，提供每张图像对应的真实Mermaid代码。

实验结果数据

Qwen3-VL-32B-Instruct 结果：位于 FlowVQA_Result_Qwen3/ 目录，包含5次运行（基线 + EdgeFlow）的评估结果。
Qwen3.5-35B-A3B 结果：位于 FlowVQA_Result_Qwen3.5/ 目录，包含5次运行（基线 + EdgeFlow）的评估结果。

每个 .xlsx 文件对应一次实验运行。其中：

批处理名称以 batch_baseline_run_ 前缀开头的行表示基线条件。
批处理名称以 batch_canny_run_ 前缀开头的行表示EdgeFlow条件。

其他说明

IndusReqFlow的结果（RQ1、RQ2）因涉及华为内部需求文档的专有性，未包含在本数据集中。

搜集汇总

数据集介绍

构建方式

在工业需求工程领域，流程图作为承载控制流逻辑的核心视觉化工具，常常以静态图片形式嵌入文档，导致其机器可读性严重不足。为弥合这一鸿沟，我们构建了IndusReqFlow数据集。该数据集源自华为企业级系统需求文档，涵盖光网络、数据通信与电动汽车系统三个工业领域，共包含52幅真实工业流程图。每幅流程图均由经验丰富的测试工程师手工标注对应的Mermaid代码，并经由双人独立验证与交叉复核流程确保标注质量——其中8幅存在分歧（占15.4%），3幅通过讨论消除分歧，剩余5幅则引入领域专家进行仲裁。最终，每幅工业流程图平均包含11.15个节点与11.73条边，反映了工业场景中真实且结构紧凑的需求规范特征。

特点

IndusReqFlow数据集的核心优势源于其对真实工业场景的忠实还原。相较于公开的合成数据集，该数据集的工业流程图呈现出显著更高的视觉噪声水平（背景噪声标准差σ=33.79，为合成数据集的1.70倍）与更严重的光照不稳定性（背景颜色均值差5.38，约2倍于合成数据）。此外，工业文档中常见的扫描伪影、复印退化、纸张老化及各类非标准符号，造就了重叠连接线、无跳越标记的交叉线与歧义性标注等结构性模糊特征。这些独特的噪声与歧义特性，使得IndusReqFlow成为评估视觉语言模型在恶劣实际场景下拓扑感知能力的严苛基准，有效弥补了当前研究过度依赖理想合成数据的评价缺口。

使用方法

对该数据集的使用充分遵循工业级评估的严谨流程。研究人员可将每幅流程图作为单一评估单元，通过标准的零样本提示策略，驱动视觉语言模型生成对应的Mermaid代码。为获得稳定结果，建议在固定采样温度（0.3）下执行多次独立运行，并基于精确字符串匹配准则在节点、边与路径三个拓扑层次进行全面评估。在统计推断层面，宜采用Wilcoxon符号秩检验搭配Cliff's Delta效应量进行成对分析，以严格量化方法间的显著性差异与效果规模。特别值得注意的是，该数据集还可用于下游任务评估：通过将生成的Mermaid代码解析为邻接表结构，进行深度优先搜索枚举全路径序列，从而支持模型路径级正确性检验及其在基于模型的测试工作流中的实际效益评估。

背景与挑战

背景概述

IndusReqFlow是一个由华为加拿大研究院的Zhifei Dou与Shabnam Hassani等研究人员于2025年创建的工业级流程图数据集，旨在解决需求工程领域中视觉规范与自动化工具之间的鸿沟。该数据集由52张源自华为系统级需求文档的真实工业流程图构成，横跨光网络、数据通信与电动汽车系统等多个领域。其核心研究问题在于，当前视觉语言模型在处理嵌入静态图像中的流程图时，常因拓扑结构感知错位而无法完整保留节点连通性与边方向，严重制约了基于模型的测试、可追溯性检查等下游任务。IndusReqFlow的提出填补了合成数据与实际工业噪声之间的迁移空白，为评估拓扑保留型流程图到机器可读模型（如Mermaid代码）的转换方法提供了关键基准。该数据集对需求工程领域产生了深远影响，推动开发无需标注数据或领域微调的实用化解决方案，并强调了在工业真实场景下验证VLM工具的必要性。

当前挑战

IndusReqFlow所解决的领域问题为视觉流程图的结构化提取与拓扑保留转换，其核心挑战在于：1)视觉语言模型普遍存在“拓扑盲点”，即对细粒度连接线、箭头方向等高频几何信号感知不足，导致节点边误判率高企；2)工业文档中的扫描伪影、复印退化、非标准符号及重叠连接器引入剧烈背景噪声（噪声标准差高达33.79），远超合成数据集的19.86，严重干扰模型推理；3)路径级评估揭示了级联式错误传播——即便节点与边F1分别达到81%与66%，单一标签错配即可使整条测试路径失效，导致路径F1仅达29%。在构建过程中，标注分歧出现在15.4%的流程图中，需多位测试工程师通过专家判断解决，突显了工业注释的复杂性与高成本。此外，跨数据集验证表明，在干净合成数据上效果提升微乎其微，进一步暴露了当前基准无法反映真实工业挑战的局限性。

常用场景

经典使用场景

在需求工程与模型驱动开发领域，流程图作为系统行为、业务逻辑与操作流程的核心可视化载体，却常以静态图像形式嵌入文档，形成阻碍自动化处理的“视觉规约鸿沟”。IndusReqFlow数据集正是为弥合这一鸿沟而构建，其经典使用场景聚焦于借助视觉语言模型实现工业级流程图向可编辑、可执行的Mermaid代码的高保真转换。通过提供来自华为光网络、数据通信及电动汽车系统等真实工业领域的52张流程图，该数据集为评估模型在噪声背景、结构歧义及非标准符号等复杂条件下的拓扑感知能力设立了严苛标尺，尤其适用于验证边缘映射增强策略在恢复关键控制流细节（如节点连通性与箭头方向）方面的效能。

衍生相关工作

IndusReqFlow数据集的发布催生了多项富有启发性的后续工作。基于其揭示的拓扑感知瓶颈，研究者们开始探索替代性结构先验方案，例如利用可学习轮廓检测器替代经典的Canny算子，以适应状态机与序列图等具有不同视觉约定的行为模型。在评估方法论层面，该数据集推动了跨组织、多领域工业基准的社区化构建倡议，旨在建立更全面的VLM驱动需求工程工具评估体系。此外，数据集中路径级评估的严苛性促使学界开发了面向组合式错误传播的分解式度量方案，将节点、边与路径三个层面的正确性进行层次化解耦分析，这一思路已被后续论文借鉴，用于验证训练无关的提示工程策略在工业级图型理解任务上的泛化能力。

数据集最近研究