five

Forgis/FactoryNet_Dataset

收藏
Hugging Face2026-05-01 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Forgis/FactoryNet_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
FactoryNet是一个大规模、多机器的工业数据集,专为工业机器人和制造异常检测设计。该数据集通过将来自完全不同机器的高频物理数据统一到一个数学上统一的坐标系中,解决了工业数据集分散的问题。数据集包含来自三种不同开源工业数据集的数据:UMich CNC Mill Tool Wear Dataset(3轴CNC铣床)、AURSAD(UR3e 6轴协作机器人)和voraus-AD(Yu-Cobot 6轴协作机器人)。每种机器都有不同的任务和异常类型。数据集提供了原始值和标准化值两种配置,便于不同用途的研究。标准化模式通过统一前缀命名和轴索引,使得跨机器学习成为可能。

FactoryNet is a large-scale, multi-machine industrial dataset designed for industrial robotics and manufacturing anomaly detection. It solves the problem of siloed industrial datasets by unifying high-frequency physical data from completely different machines into a single, mathematically unified coordinate system. The dataset includes data from three distinct open-source industrial datasets: UMich CNC Mill Tool Wear Dataset (3-Axis CNC Mill), AURSAD (UR3e 6-Axis Collaborative Robot), and voraus-AD (Yu-Cobot 6-Axis Collaborative Robot). Each machine has different tasks and anomaly types. The dataset is available in two configurations: raw values and normalized values, facilitating research for different purposes. The standardized schema, with unified prefix naming and axis indexing, enables cross-machine learning.
提供机构:
Forgis
搜集汇总
数据集介绍
main_image_url
构建方式
FactoryNet_Dataset的构建基于对多个高度异构的工业数据源进行系统性整合与统一,其核心在于创建一个支持跨机器学习的标准化数据表示。该数据集融合了来自三套公开数据集的百万级高频传感数据:密歇根大学的UMich CNC铣床刀具磨损数据集、AURSAD协作机器人螺丝锁付异常数据集,以及voraus-AD协作机器人抓取放置任务数据集。为消除原始数据中超过300种歧义列名与单位差异,所有变量被严格映射至FactoryNet统一架构,采用前缀命名规范(如setpoint_、feedback_、effort_、ctx_)区分指令、状态、物理量与上下文信息,并对从多关节至笛卡尔坐标的所有运动轴进行零起始索引标准化。数据提供raw与normalized两种配置:raw保留原始物理量(安培、伏特、弧度等),适合物理启发的神经网络;normalized则对同一机器的连续物理变量执行Z-score标准化,便于深度学习与基础模型训练。
特点
该数据集的显著特点在于其跨机器、跨任务、高频率的物理信号融合能力,打破了传统工业数据集的孤岛效应。通过在数学上对齐来自三轴数控铣床、六轴协作机器人及输送线系统的传感信息,FactoryNet赋予神经网络学习超越硬件边界的通用物理关系的能力。数据覆盖正常操作与12种以上物理异常场景,包括刀具磨损、螺纹损坏、夹持误差、碰撞及轴系磨损等,异常标签与原始配置一一对应。数据格式采用高度压缩的Parquet文件,兼顾规模化存储与高效读取效率,使得单次数据加载即可容纳数千万行记录,无需担心本地内存瓶颈。每列数据严格遵循语义命名与单位定义,增强内容可解释性,同时保留上下文元数据(如机器类型、总线电压),为多模态学习、迁移学习与异常检测任务奠定结构化基础。
使用方法
使用FactoryNet_Dataset进行模型开发时,用户可通过HuggingFace datasets库便捷加载所需配置,并利用Parquet的分区特性实现低内存开销的数据读取。以Python为例,仅需调用`load_dataset(‘karimm6/FactoryNet_Dataset’, ‘normalized’)`即可获取标准化后的训练集,随后可通过`.to_pandas()`方法转换为Pandas DataFrame进行探索分析、特征工程或模型训练。序列化后的数据保留了完整的列语义与异常标签,用户可直接用于监督学习(如异常分类)、自监督预训练(如掩码重构)或物理仿真验证。若需灵活按需筛选机器类型或异常模式,可利用DataFrame的列索引功能高效子集提取。此外,raw配置为物理量建模保留原生单位,便于结合领域先验知识进行阈值设定或物理方程嵌入,支持从纯数据驱动到物理信息驱动的多样化研究方法。
背景与挑战
背景概述
FactoryNet_Dataset由研究人员Karim等人于近年创建,旨在解决工业机器人与制造领域中异常检测数据集长期存在的碎片化问题。传统工业数据集因制造商和研究团队使用不同的列名、单位及数据结构而形成严重的信息孤岛,限制了跨机器、跨场景的通用物理关系学习。该数据集通过整合来自密歇根大学CNC铣床刀具磨损数据集、AURSAD自动化螺丝拧紧异常数据集以及voraus-AD协同机器人拾放数据集,构建了一个统一的数学坐标系统,将高频率传感器数据标准化为通用架构。FactoryNet的出现为工业基础模型训练和物理信息神经网络的发展奠定了重要基础,推动了制造业人工智能从专用模型向通用泛化能力的转变。
当前挑战
FactoryNet所解决的领域问题核心在于工业异常检测中跨硬件平台的模型泛化挑战,传统方法受限于单个机器的传感器命名和物理单位差异,难以在异构机器间共享知识。在构建过程中,团队面临了三大具体挑战:首先是将来自三个独立数据集的超过300种冲突变量名映射到统一的FactoryNet架构,需确保物理意义的一致性;其次是坐标轴索引的标准化,需将不同机器的关节编号方式(如X/Y/Z或1-6)统一为零基索引;最后是数据分区的压缩与高效加载,在保留数亿行高频数据的同时,通过Parquet格式实现内存友好型的随机访问,避免本地内存溢出。
常用场景
经典使用场景
FactoryNet_Dataset为工业机器人与制造领域的多机异常检测研究提供了标准化的基础数据集。研究者可利用该数据集训练统一的跨机器异常检测模型,通过统一的数学坐标系统,将来自不同型号机器(如三轴数控铣床、UR3e协作机器人和Yu-Cobot协作机器人)的高频传感器信号整合在一起,从而在统一的特征空间内学习刀具磨损、螺丝拧紧异常、抓取错误等多种物理异常的通用表征。该数据集天然支持域泛化实验,适用于迁移学习、多任务学习及跨机器故障诊断等前沿课题。
解决学术问题
该数据集解决了工业领域长期存在的数据孤岛问题——不同制造商和研究团队采用各异的变量命名、物理单位和数据结构,导致跨机器、跨场景的通用机器学习模型难以训练。通过将超过300个原始变量映射至统一前缀体系(如setpoint_、feedback_、effort_、ctx_),并实施严格的零基轴索引标准化,FactoryNet使得神经网络能够跨越硬件边界学习普适的物理关系。这一突破为基于物理信息的神经网络、基础模型预训练以及源域自适应等学术研究提供了坚实的实验平台,标志着工业数据集从碎片化走向标准化的关键一步。
衍生相关工作
FactoryNet衍生出一系列开创性研究方向,包括跨机器物理信息迁移学习、多源域异常检测特征对齐以及工业时序数据的视觉-语言多模态预训练。其统一的数值框架为构建工业基础模型奠定了基础,催生了一批使用预训练-微调范式的下游技术,如基于Transformer的跨机器故障分类器、残差网络驱动的物理异常定位网络,以及对比学习框架下的无监督特征解耦方法。这些工作共同推动了工业人工智能从单一任务向通用智能体的演进,深刻影响了制造领域数据驱动决策的理论与实践范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作