five

FactoryNet_Dataset

收藏
Hugging Face2026-03-06 更新2026-03-07 收录
下载链接:
https://huggingface.co/datasets/Forgis/FactoryNet_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
FactoryNet是一个大规模、适用于机器学习的工业机器人和制造异常检测基础数据集。该数据集通过将来自完全不同机器的高频物理数据整合到一个单一的数学统一坐标系中,解决了工业数据孤岛问题。数据集包含来自三个不同开源工业数据集的数据:UMich CNC Mill Tool Wear Dataset(用于检测刀具磨损和视觉检查失败)、AURSAD(用于检测螺丝拧紧过程中的异常)和voraus-AD(用于检测工业拾取放置任务中的12种不同物理异常)。所有原始变量(之前有超过300个冲突名称)都被映射到一个标准化的FactoryNet模式中,包括标准化的前缀命名(如setpoint_*、feedback_*、effort_*、ctx_*)和轴索引(严格从0到5)。数据集以高度压缩的Parquet文件形式提供,有两种配置:raw(原始物理值)和normalized(所有连续物理变量已独立标准化)。
创建时间:
2026-03-04
原始信息汇总

FactoryNet 数据集概述

数据集基本信息

  • 数据集名称: FactoryNet
  • 托管地址: https://huggingface.co/datasets/Forgis/FactoryNet_Dataset
  • 核心目标: 为工业机器人与制造异常检测提供大规模、机器学习就绪的基础数据集,解决工业数据孤岛问题。

数据集构成

数据集融合了三个不同的开源工业数据集,包含数百万行高频传感器数据。

  1. UMich CNC 铣床刀具磨损数据集

    • 机器类型: 3轴CNC铣床
    • 任务: 在不同进给率和夹紧压力下加工蜡块。
    • 异常类型: 刀具磨损(未磨损 vs. 磨损)和视觉检测失败。
  2. AURSAD(自动UR3e拧螺丝异常数据集)

    • 机器类型: UR3e 6轴协作机器人
    • 任务: 使用OnRobot螺丝刀进行自动拧螺丝操作。
    • 异常类型: 正常操作、螺丝损坏、螺丝缺失、多余零件、螺纹损坏。
  3. voraus-AD(Yu-Cobot 拾取与放置数据集)

    • 机器类型: Yu-Cobot 6轴协作机器人
    • 任务: 在传送带上进行工业拾取与放置任务。
    • 异常类型: 12种不同的物理异常,包括轴磨损(摩擦/误换向)、抓取错误、碰撞和附加轴重。

统一数据模式

为支持跨机器学习,所有原始变量(此前有超过300个冲突的名称)均被映射到一个标准化的FactoryNet模式中。

  • 标准化前缀命名:
    • setpoint_*: 控制器发出的指令目标(例如 setpoint_pos_0)。
    • feedback_*: 传感器测量的实际状态(例如 feedback_vel_1)。
    • effort_*: 施加的物理力/电流(例如 effort_current_2, effort_torque_0)。
    • ctx_*: 上下文元数据(例如 ctx_anomaly_label, ctx_busvoltage_0)。
  • 标准化轴索引: 无论原始制造商如何编号其关节(X/Y/Z 或 1-6),本数据集中的所有轴均严格采用零基索引(05)。

数据配置

数据集被分割为高度压缩的Parquet文件,提供两种配置:

  1. raw(原始配置): 原始物理值(安培、伏特、弧度等)直接映射到新模式的版本。适用于物理信息神经网络或特定领域的阈值处理。
  2. normalized(标准化配置): 所有连续物理变量均已使用专门针对该机器领域拟合的Z-score缩放器(StandardScaler)进行了独立标准化。适用于直接的深度学习和基础模型训练。

数据加载方式

使用Python的datasets库加载数据集。 python from datasets import load_dataset

加载标准化配置的数据集

dataset = load_dataset("karimm6/FactoryNet_Dataset", "normalized")

转换为Pandas DataFrame

df = dataset[train].to_pandas()

搜集汇总
数据集介绍
构建方式
FactoryNet数据集通过整合三个独立的开源工业数据集构建而成,涵盖数控铣床、协作机器人螺丝拧紧及拾取放置任务。原始数据包含数百万行高频传感器读数,经过严格的数学统一处理,将不同机器的物理信号映射至标准化坐标系。所有变量均采用统一的前缀命名规则,如设定点、反馈、力矩及上下文元数据,并采用零索引轴编号,消除了制造商间的命名与单位差异。数据以高度压缩的Parquet格式存储,支持原始物理值与标准化两种配置,为跨机器学习提供了结构一致的基础。
特点
该数据集的核心特点在于其跨机器统一性,通过将异构工业设备的高频传感器数据映射至单一数学坐标系,实现了物理关系的学习泛化。数据集涵盖多种异常类型,包括刀具磨损、螺丝损坏、抓取错误及碰撞等,模拟了真实制造场景中的多样化故障模式。标准化前缀命名与轴索引确保了数据结构的一致性,而原始与标准化双配置则兼顾了物理建模与深度学习的需求。这种设计使得神经网络能够突破硬件边界,从统一表征中提取普适的工业物理规律。
使用方法
使用FactoryNet数据集时,可通过Hugging Face的datasets库直接加载原始或标准化配置,利用Parquet格式的分区特性高效处理大规模数据而无需完全载入内存。标准化版本已通过Z-score缩放处理,适用于深度学习模型的直接训练;原始版本则保留物理单位,适合基于物理信息的阈值分析或专业模型开发。加载后数据可转换为Pandas DataFrame进行探索性分析,如统计机器类型分布或异常标签频率,为工业异常检测与机器人控制研究提供即用型数据基础。
背景与挑战
背景概述
工业制造领域长期面临数据孤岛问题,不同厂商与研究团队采用异构的传感器命名规范、物理单位及数据结构,严重阻碍了通用机器学习模型的开发。FactoryNet数据集应运而生,由研究团队整合了来自密歇根大学CNC铣床刀具磨损数据、UR3e协作机器人螺丝装配异常数据以及Yu-Cobot拾放操作异常数据,旨在构建一个统一坐标体系的大规模多机工业数据集。该数据集通过标准化轴索引、设定点信号与反馈变量,为跨硬件边界的物理关系学习提供了坚实基础,推动了工业异常检测与机器人智能的范式革新。
当前挑战
该数据集致力于解决工业异常检测中模型泛化能力不足的核心挑战,即如何让神经网络跨越不同机器类型与任务边界,识别通用的物理异常模式。在构建过程中,研究团队需克服原始数据中超过300种冲突变量名的映射难题,将异构的传感器数据(如电流、位置、扭矩)统一至标准化的前缀命名体系。此外,还需设计合理的数学变换方法,在保留原始物理含义与提供标准化深度学习输入之间取得平衡,确保数据既适用于物理信息神经网络,也能直接支持基础模型训练。
常用场景
经典使用场景
在工业制造与机器人领域,FactoryNet数据集为跨机器异常检测提供了统一的学习框架。通过整合来自数控铣床、协作机器人螺丝拧紧及拾取放置任务的高频传感器数据,该数据集将异构的物理信号映射至标准化的坐标系统。研究人员能够利用其标准化前缀命名与轴索引,构建深度学习模型,以识别工具磨损、螺丝损坏、抓取错误等多样化异常,从而实现对不同硬件平台上工业过程的泛化监控与诊断。
实际应用
在实际工业场景中,FactoryNet数据集支持智能制造系统的预测性维护与质量控制。企业可基于其标准化数据训练模型,实时监测数控机床、协作机器人等设备的运行状态,提前预警工具磨损、装配错误或机械故障。这不仅减少了非计划停机时间,提升了生产线效率,还为自动化系统的自适应优化与安全运行提供了数据驱动的决策依据,助力工业4.0的落地实施。
衍生相关工作
围绕FactoryNet数据集,已衍生出多项经典研究工作,主要集中在跨机器异常检测算法与工业基础模型构建。例如,研究者利用其标准化架构开发了基于Transformer的时序预测模型,以识别多设备间的共性故障模式;同时,该数据集也促进了物理信息神经网络在工业场景的应用,将传感器数据与机械动力学结合,提升模型的可解释性与泛化能力,为工业人工智能的标准化评估奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作