半导体制造时间序列数据集
收藏arXiv2024-08-18 更新2024-08-21 收录
下载链接:
http://arxiv.org/abs/2408.09307v1
下载链接
链接失效反馈官方服务:
资源简介:
半导体制造时间序列数据集是由亚利桑那州立大学基于英特尔半导体制造工厂的基准模型构建的。该数据集包含372个模拟场景,涵盖不同批次大小和配置,以及修复状态和晶圆生成数据。数据集通过离散事件时间轨迹构建,适用于开发单变量和多变量机器学习模型。该数据集主要用于机器学习社区中的行为分析,特别是在基于形式化和可扩展的组件基离散事件模型和模拟方面。
This Semiconductor Manufacturing Time Series Dataset was developed by Arizona State University based on the benchmark model of Intel's semiconductor manufacturing fab. It contains 372 simulation scenarios covering diverse batch sizes, configurations, repair statuses, and wafer fabrication data. Constructed via discrete-event time trajectories, this dataset is suitable for developing both univariate and multivariate machine learning models. It is primarily intended for behavioral analysis in the machine learning community, particularly for research based on formal and scalable component-based discrete-event models and simulations.
提供机构:
亚利桑那州立大学
创建时间:
2024-08-18
搜集汇总
数据集介绍

构建方式
半导体制造时间序列数据集的构建基于组件化的离散事件模拟模型,通过使用Parallel Discrete-Event System Specification (PDEVS)进行模型形式化,并利用DEVSSuite模拟器执行。时间序列数据集是通过离散事件时间轨迹构建的,这些数据来源于对Intel半导体制造工厂模型的模拟。数据集不仅包含了制造过程中的关键变量,如库存、机器状态和晶圆运输路线,还包含了不同制造配置下的吞吐量和周转时间等指标。
特点
该数据集的特点在于其复杂性、多样性和实用性。它模拟了半导体制造过程中的各种场景,包括不同晶圆批次的生成、不同的修复模式和工厂配置。数据集的粒度达到了分钟级别,能够提供详细的时间序列数据,有助于分析制造过程中的动态行为和趋势。此外,数据集还包含了丰富的特征,如时间序列的滞后特征、趋势、偏度和熵等,这些特征可以用于开发机器学习模型,以预测和优化半导体制造过程。
使用方法
半导体制造时间序列数据集可以用于多种目的,包括但不限于:开发机器学习模型以预测和优化半导体制造过程,分析制造过程中的动态行为和趋势,以及评估不同制造配置和修复模式对生产效率的影响。数据集的使用方法包括:首先,利用时间序列分析技术,如ARIMA、RNN、LSTM、TCN和TFT,对数据进行建模和预测。其次,通过特征提取和分析,识别关键影响因素,并用于优化制造过程。最后,通过比较不同模型和配置的预测结果,选择最佳的制造策略。
背景与挑战
背景概述
半导体制造领域对于智能化生产的需求日益增长,离散事件模型及其模拟器在半导体芯片制造的设计、建设和运营中发挥着关键作用。该领域面临的挑战包括复杂的生产过程和精确的行为模拟。为了支持机器学习模型的发展,研究者们需要一个基于实际工厂模型、结构简洁且行为准确的公开基准模拟模型。因此,该数据集基于英特尔半导体制造厂的基准模型构建,使用并行离散事件系统规范进行形式化,并使用DEVSSuite模拟器执行。时间序列数据集通过离散事件时间轨迹构建,可用于开发基础的单变量和多变量机器学习模型。
当前挑战
该数据集所解决的领域问题是半导体制造中的智能化生产,具体挑战包括:1) 复杂的生产过程和精确的行为模拟;2) 构建过程中所遇到的挑战,如如何从实际工厂中收集数据、如何组织、维护和同步不同机器之间的数据等。
常用场景
经典使用场景
半导体制造时间序列数据集为研究人员提供了宝贵的资源,用于开发和评估机器学习模型,以模拟和优化半导体制造过程。该数据集通过离散事件模拟模型生成,涵盖了各种生产配置和机器状态,为时间序列分析和预测提供了丰富的数据。研究人员可以利用这些数据来构建和测试不同的机器学习模型,如ARIMA、RNN、LSTM、TCN和TFT,以预测工厂的吞吐量和周转时间,从而提高生产效率和降低成本。
实际应用
半导体制造时间序列数据集在实际应用中具有广泛的应用前景。例如,它可以用于优化生产配置,预测工厂的吞吐量和周转时间,从而提高生产效率和降低成本。此外,它还可以用于开发替代模型,这些模型可以用于模拟和预测半导体制造过程中的各种事件,如机器故障和维修,从而提高生产效率和降低成本。
衍生相关工作
半导体制造时间序列数据集为相关研究提供了重要的基础。例如,研究人员可以利用该数据集来开发更先进的机器学习模型,以预测和优化半导体制造过程中的各种事件。此外,该数据集还可以用于构建更精确的生产模型,以模拟和预测半导体制造过程中的各种事件,从而提高生产效率和降低成本。
以上内容由遇见数据集搜集并总结生成



