five

vynfi-supply-chain-ocel

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/VynFi/vynfi-supply-chain-ocel
下载链接
链接失效反馈
官方服务:
资源简介:
VynFi Supply Chain OCEL 是一个制造业供应链的原生 OCEL 事件日志数据集,包含 20,010 个事件、7,427 个对象和 7,961 个异常标签。数据是通过 DataSynth 2.5 OCPM 引擎生成的,包含 P2P(点对点)、O2C(订单到现金)、S2C(供应链到客户)和制造等过程类型,并注入了 3% 的欺诈数据。数据集分为四个配置:events(20,010 条记录,26 列)、objects(7,427 条记录,9 列)、anomaly_labels(7,961 条记录,36 列)和 document_events(377 条记录,5 列)。该数据集适用于时间序列预测、流程挖掘和供应链分析等任务。数据完全是合成的,采用 Apache 2.0 许可证。
创建时间:
2026-04-15
原始信息汇总

VynFi Supply Chain OCEL 数据集概述

数据集基本信息

  • 数据集名称: VynFi Supply Chain OCEL
  • 发布者/作者: Michael Ivertowski
  • 发布日期: 2026年
  • 许可证: Apache 2.0
  • 数据性质: 完全合成数据

数据集内容与规模

  • 数据描述: 来自制造业供应链的原生OCEL事件日志。
  • 核心规模: 包含20,010个事件和7,427个对象。
  • 异常标签: 包含7,961个异常标签。
  • 数据生成: 使用DataSynth 2.5 OCPM引擎生成。
  • 流程类型: 包含P2P、O2C、S2C和制造流程。
  • 欺诈注入: 注入了3%的欺诈数据。
  • 规模分类: 10K < n < 100K。

数据集配置与结构

数据集包含四个配置,具体如下:

配置名称 记录数 列数
events 20,010 26
objects 7,427 9
anomaly_labels 7,961 36
document_events 377 5

任务类别与标签

  • 任务类别: 时间序列预测、其他。
  • 标签: 合成、金融数据、vynfi、流程挖掘、ocel、供应链。

快速使用

python from datasets import load_dataset events = load_dataset("VynFi/vynfi-supply-chain-ocel", "events", split="train") objects = load_dataset("VynFi/vynfi-supply-chain-ocel", "objects", split="train")

已知局限性

  • 事件与对象的关系以字符串化数组形式存储。
  • document_events配置是从文档流头信息重建的。

引用信息

bibtex @dataset{ivertowski_vynfi_ocel_2026, title = {VynFi Supply Chain OCEL}, author = {Michael Ivertowski}, year = {2026}, url = {https://huggingface.co/datasets/VynFi/vynfi-supply-chain-ocel}, note = {Generated with VynFi (https://vynfi.com)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在供应链管理领域,高质量的事件日志对于流程挖掘与异常检测至关重要。VynFi供应链OCEL数据集采用DataSynth 2.5 OCPM引擎合成生成,模拟了采购到付款、订单到现金、供应商到客户以及制造等核心业务流程。该数据集注入了3%的欺诈性异常事件,共包含20,010条事件记录、7,427个对象及7,961个异常标签,事件与对象间的关系以序列化数组形式存储,文档事件则从文档流头部重构而来,确保了数据的复杂性与真实性。
特点
该数据集作为原生对象中心事件日志,具备多维度特性。其涵盖26个事件属性列与9个对象属性列,结构上划分为事件、对象、异常标签及文档事件四个独立配置,支持对供应链全流程的细粒度分析。数据集规模适中,介于一万至十万条记录之间,且完全基于合成数据生成,既避免了真实数据的隐私与合规风险,又通过模拟真实业务逻辑与注入异常模式,为算法验证与模型训练提供了可靠基准。
使用方法
研究人员可通过Hugging Face的datasets库便捷加载此数据集。使用load_dataset函数并指定相应配置名称,如“events”或“objects”,即可分别获取训练分割下的事件日志或对象信息。该数据集适用于时间序列预测、流程挖掘及异常检测等任务,用户可结合事件、对象与异常标签进行关联分析,以探索供应链中的流程模式、性能瓶颈或欺诈行为,从而推动智能供应链分析与决策支持系统的开发。
背景与挑战
背景概述
在供应链管理与流程挖掘领域,高质量的事件日志数据对于分析复杂业务流程、检测异常及优化运营至关重要。VynFi Supply Chain OCEL数据集由Michael Ivertowski于2026年创建,并利用VynFi公司的DataSynth 2.5 OCPM引擎生成。该数据集以对象中心事件日志(OCEL)格式呈现,模拟了制造业供应链中的采购到付款(P2P)、订单到现金(O2C)、寻源到合同(S2C)及生产制造等多类流程,包含超过两万条事件记录和七千余个对象实体。作为完全合成的数据集,它旨在为研究人员提供一个可控且丰富的测试平台,以推动流程挖掘、时间序列预测及金融数据分析等方向的方法创新,尤其在供应链欺诈检测与流程优化方面具有显著的应用潜力。
当前挑战
该数据集致力于应对供应链流程挖掘中的核心挑战,即如何在多实体交互的复杂事件流中准确识别异常模式与瓶颈环节。具体而言,其构建过程面临合成数据真实性与多样性的平衡问题,需确保生成的流程逻辑符合实际业务规则,同时注入3%的欺诈行为以模拟现实场景。此外,数据以OCEL格式组织,事件与对象间的关联以字符串化数组存储,这增加了数据解析与关系重建的复杂性;而文档事件配置需从文档流头部重构,可能引入信息完整性风险。这些挑战共同要求分析方法具备处理高维时序关系与稀疏异常检测的能力,以提升供应链透明性与韧性。
常用场景
经典使用场景
在供应链管理领域,VynFi Supply Chain OCEL数据集为过程挖掘研究提供了丰富的合成事件日志。该数据集模拟了采购到付款、订单到现金、寻源到合同及制造等核心业务流程,包含超过两万条事件记录和七千多个对象,广泛应用于构建和验证过程模型。研究者利用其结构化的对象中心事件日志格式,能够深入分析供应链中的活动序列、资源交互及异常模式,为流程优化与合规性检查奠定数据基础。
解决学术问题
该数据集有效应对了供应链研究中真实数据稀缺与隐私敏感的挑战,通过注入3%的欺诈标签,为异常检测算法提供了标准化的评估基准。它支持学术界探索过程挖掘中的偏差识别、合规性监控及性能瓶颈分析等关键问题,促进了对象中心事件日志在复杂业务环境下的方法论发展。其合成性质确保了数据的可重复性与可扩展性,显著降低了实证研究的门槛,推动了供应链智能分析领域的理论创新。
衍生相关工作
围绕该数据集,已衍生出多项聚焦于供应链过程挖掘与异常检测的经典研究。例如,学者利用其对象中心事件日志结构开发了新型过程发现算法,以更精准地映射多实体交互网络;同时,基于注入的欺诈标签,研究团队提出了结合图神经网络与时间序列分析的方法,用于识别隐蔽的供应链风险。这些工作不仅丰富了过程挖掘的技术体系,也为跨领域的业务过程分析提供了可借鉴的框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作