AURSAD
收藏arXiv2021-07-05 更新2024-06-21 收录
下载链接:
https://github.com/CptPirx/AURSAD-source
下载链接
链接失效反馈官方服务:
资源简介:
AURSAD数据集由奥胡斯大学电气与计算机工程系创建,专注于自动螺丝驱动过程中的异常检测。该数据集包含2045个样本,涵盖了从正常操作到各种故障情况的全面监控数据。数据收集过程设计精细,确保了时间序列数据的质量,并提供了丰富的传感器信息。AURSAD数据集适用于机器学习模型的训练和测试,特别是在自动化工业制造中提高效率和质量控制方面具有重要应用价值。
The AURSAD dataset was developed by the Department of Electrical and Computer Engineering, Aarhus University, focusing on anomaly detection during automated screw driving processes. It contains 2045 samples, encompassing comprehensive monitoring data ranging from normal operations to various fault scenarios. The data collection process was rigorously designed to ensure the quality of the time-series data and provides rich sensor information. The AURSAD dataset is suitable for the training and testing of machine learning models, and holds significant application value in improving efficiency and quality control in automated industrial manufacturing.
提供机构:
奥胡斯大学电气与计算机工程系
创建时间:
2021-07-05
搜集汇总
数据集介绍

构建方式
在工业自动化装配领域,自动拧螺丝操作的故障检测对保障生产质量至关重要。AURSAD数据集的构建依托于一套精密的实验系统,该系统集成了UR3e工业机器人与OnRobot螺丝刀附件,以100Hz的采样频率同步采集了125维传感器数据。数据采集过程模拟了完整的螺丝拧紧与松开操作序列,涵盖从初始位置移动、螺丝拾取、拧紧到返回原位的全过程。研究人员通过精心设计的控制变量,在2045个样本中系统性地引入了四种主要故障类型,包括螺丝损坏、螺丝缺失、额外装配组件以及螺纹孔损坏,同时保留了完整的正常操作样本,确保了数据集的多样性与真实性。
特点
该数据集的核心特点在于其多维时间序列的完备性与标注的精细度。它不仅完整记录了机器人关节位置、速度、扭矩以及末端工具加速度等125个传感器维度,还包含了用于辅助标注的8个控制变量。数据集的样本结构灵活,用户可根据研究需求选择完整操作序列或特定子阶段进行分析。尤为突出的是,其异常样本占比达到30.5%,涵盖了语义清晰的四类故障,且每类故障在传感器读数上呈现出可区分的时序模式,为模型学习提供了丰富的判别特征。此外,配套的Python库极大简化了数据预处理与标注流程。
使用方法
该数据集主要服务于基于机器学习的异常检测与故障分类研究。使用者可借助公开的Python库加载数据,并根据需要过滤控制变量,提取纯传感器特征。数据集支持多种任务范式:用户可进行多类别故障分类,亦可合并所有异常样本构建二分类异常检测问题。在模型构建时,需注意处理变长时间序列,可采用零填充或分段采样等方法统一输入维度。论文中提供的ResNet与TABL模型基准为后续研究提供了性能参照。研究者还可利用数据集中的布尔标志位分离拧紧、松开等子操作,进行更细粒度的过程建模与分析。
背景与挑战
背景概述
在工业制造领域,自动化螺丝拧紧作为装配流程的核心环节,其质量监控对提升生产效率至关重要。AURSAD数据集由奥胡斯大学与Technicon ApS的研究团队于2021年联合创建,旨在通过机器学习方法解决自动螺丝拧紧过程中的异常检测问题。该数据集收录了来自UR3e机器人与OnRobot螺丝刀附件的多维度传感器时序数据,涵盖正常操作与四类典型故障场景,为工业异常检测研究提供了标准化基准。其公开的标注数据与配套工具库,显著推动了智能制造领域数据驱动故障诊断模型的发展。
当前挑战
该数据集致力于解决自动螺丝拧紧场景下的多类别异常识别挑战,包括螺丝损坏、部件缺失、装配冗余及螺纹孔损伤等复杂故障模式。构建过程中面临多重困难:一方面需在真实工业环境中采集高频率、多源异构的传感器时序数据,确保数据同步与标注准确性;另一方面,故障样本的天然不均衡性(如螺纹孔损伤类样本极少)增加了模型训练的难度。此外,如何从125维特征中提取有效表征,并区分故障间的细微差异,亦是算法设计的关键难点。
常用场景
经典使用场景
在工业自动化领域,螺丝拧紧作为装配环节的核心工序,其质量直接影响产品可靠性与生产效率。AURSAD数据集通过记录UR3e机器人与OnRobot螺丝刀在正常与异常操作下的完整传感器时序数据,为机器学习模型提供了精准的训练基础。该数据集最经典的应用场景在于构建智能故障检测系统,研究人员可利用其标注的2045个样本,训练深度学习模型实时识别螺丝损坏、零件缺失、螺纹损伤等四类典型装配异常,实现制造过程的自动化质量监控。
解决学术问题
该数据集有效解决了工业异常检测领域长期存在的若干关键问题。传统方法依赖人工定义故障模式,难以应对复杂多变的装配异常,而AURSAD提供的多维度时序数据使数据驱动方法成为可能。其125个传感器特征覆盖了关节运动参数、工具坐标、扭矩梯度等关键物理量,为研究多变量时序模式识别提供了理想实验平台。通过提供标准化标注与可复现的实验框架,该数据集显著降低了异常检测算法的验证门槛,推动了基于深度学习的工业过程监控方法的发展。
衍生相关工作
基于AURSAD数据集,学术界衍生出多个具有影响力的研究方向。在模型架构方面,研究者通过对比时序注意力增强双线性网络与残差神经网络在该数据集上的表现,深化了对工业时序数据特征提取机制的理解。在特征工程领域,针对125维传感器数据的特征选择方法研究成为热点,相关成果为高维工业数据的降维处理提供了新思路。此外,该数据集与TMLSD数据集形成的对比研究,推动了装配过程多阶段异常检测框架的发展,为构建更精细化的智能制造监控体系奠定了理论基础。
以上内容由遇见数据集搜集并总结生成



