five

DPM-Bench

收藏
arXiv2025-02-14 更新2025-02-27 收录
下载链接:
https://github.com/HenryWedge/DistributedEnvironmentBuilder/tree/caise
下载链接
链接失效反馈
官方服务:
资源简介:
DPM-Bench是一个针对分布式过程挖掘算法的基准测试,由基尔大学的研究团队开发。该数据集用于评估和比较新发明的分布式过程挖掘算法原型。它涵盖了分布式事件日志和计算节点的形式化定义,支持计算中心的质量度量。DPM-Bench能够帮助工程师了解现有硬件在工厂中的适用性,评估实施分布式过程挖掘的可行性和相关成本。

DPM-Bench is a benchmark for distributed process mining algorithms, developed by a research team from Kiel University. This dataset is used to evaluate and compare newly invented prototypes of distributed process mining algorithms. It covers formal definitions of distributed event logs and computing nodes, and supports quality metrics for computing centers. DPM-Bench can help engineers understand the applicability of existing hardware in factories, as well as evaluate the feasibility and related costs of implementing distributed process mining.
提供机构:
基尔大学
创建时间:
2025-02-14
搜集汇总
数据集介绍
main_image_url
构建方式
DPM-Bench数据集的构建旨在满足分布式流程挖掘算法在计算物理系统(CPS)中的需求。该数据集的设计考虑了CPS中数据和计算资源的分布式和异构特性,以及网络通信的复杂性。DPM-Bench通过模拟不同计算拓扑结构中的算法部署,为评估分布式流程挖掘算法的性能提供了一个基准。数据集的构建采用了基于事件流的模型,并引入了硬件交互指令(HII)来模拟计算节点之间的交互,从而评估算法在处理时间和资源利用率等方面的表现。
特点
DPM-Bench数据集的特点在于其模拟了分布式流程挖掘在CPS中的应用场景,提供了不同拓扑结构下的算法性能比较。数据集的设计考虑了数据分布、计算资源模型和网络通信等因素,使得算法评估更加全面。此外,DPM-Bench还引入了硬件交互指令(HII)的概念,将算法与硬件资源的使用联系起来,为评估算法的硬件资源需求提供了依据。
使用方法
DPM-Bench数据集的使用方法主要包括以下步骤:首先,用户需要选择一个分布式流程挖掘算法和一个计算拓扑结构。然后,将算法和拓扑结构输入到DPM-Bench中,进行性能评估。DPM-Bench将输出一系列预定义的质量指标,包括处理时间、资源利用率、可伸缩性等,帮助用户评估算法在不同拓扑结构下的表现。此外,DPM-Bench还支持用户自定义硬件资源模型和网络通信模型,以适应不同的实验需求。
背景与挑战
背景概述
在工业4.0和智能制造的推动下,网络物理系统(CPS)已成为研究和产业界关注的焦点。CPS整合了计算资源、网络和物理组件,旨在实现自动化和定制化的生产过程。为了理解并优化这些复杂的系统,过程挖掘技术被广泛应用于分析信息系统中提取的事件数据。然而,传统的过程挖掘算法通常依赖于中心化的事件日志,这在数据分布、计算资源和网络通信具有分布性和异构性的CPS中并不适用。为此,德国基尔大学的研究人员Hendrik Reiter等人提出了DPM-Bench,一个用于比较分布式过程挖掘算法的基准。DPM-Bench旨在评估分布式过程挖掘算法在不同计算拓扑结构下的表现,以帮助信息系统工程师评估现有基础设施是否足以支持分布式过程挖掘,或者识别算法和硬件方面的改进需求。
当前挑战
DPM-Bench面临的主要挑战包括:1)在CPS中,事件数据分布在不同的源节点上,需要新的分布式过程挖掘算法来直接在边缘资源上进行计算,而无需将所有数据移动到中央云系统中。2)现有的过程挖掘算法和模型在处理分布式数据时存在局限性,缺乏对数据分布和计算资源分布的建模。3)缺乏一个全面的基准来评估分布式过程挖掘算法,特别是在考虑计算节点的特性和网络拓扑的情况下。DPM-Bench通过引入计算资源模型、分布式数据流模型和网络通信模型,为评估分布式过程挖掘算法提供了新的框架。然而,DPM-Bench仍需进一步完善,以支持更真实的硬件评估和更详细的性能分析。
常用场景
经典使用场景
DPM-Bench是一个用于比较分布式流程挖掘算法的基准测试平台,主要用于评估算法在处理来自信息系统的流程事件数据时的性能。在工业4.0的背景下,DPM-Bench特别适用于分析智能工厂中的生产过程。它通过模拟不同计算拓扑结构下的算法运行,帮助信息系统工程师评估现有基础设施是否足够支持分布式流程挖掘,或者在算法和硬件方面需要哪些改进。
实际应用
DPM-Bench的实际应用场景主要集中在工业4.0的智能工厂中,用于分析和优化生产过程。通过在边缘设备上直接进行计算,DPM-Bench帮助减少数据传输的时间和资源消耗,同时保护数据隐私。此外,DPM-Bench还可以用于评估和优化现有的硬件基础设施,以支持分布式流程挖掘。
衍生相关工作
DPM-Bench的引入促进了分布式流程挖掘领域的研究和发展。它为后续的研究提供了重要的理论基础和实验平台,使得研究人员能够更好地理解和改进分布式流程挖掘算法。此外,DPM-Bench还为工业界提供了评估和选择分布式流程挖掘算法的工具,有助于推动智能工厂和其他工业4.0应用的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作