LithoSim
收藏Hugging Face2025-05-06 更新2025-05-07 收录
下载链接:
https://huggingface.co/datasets/grandiflorum/LithoSim
下载链接
链接失效反馈官方服务:
资源简介:
LithoSim是一个用于混合机器学习基 Lithography 模拟的大规模多尺度基准数据集。
LithoSim is a large-scale multi-scale benchmark dataset for hybrid machine learning-based lithography simulation.
创建时间:
2025-05-01
原始信息汇总
数据集概述
基本信息
- 名称: litho
- 许可证: Apache 2.0
- 语言: 英语 (en)
- 标签: code
- 规模: 100B < n < 1T
描述
该数据集为 "LithoSim: Large Multi-scale Benchmark for hybrid ML-based Lithography Simulation" 的基准数据集。
相关资源
- GitHub 仓库: https://github.com/dw-hongquan/LithoSim
搜集汇总
数据集介绍

构建方式
LithoSim数据集作为光刻仿真领域的多尺度基准测试集,其构建过程体现了计算光刻与机器学习融合的前沿理念。研究团队通过物理建模与数据驱动相结合的方式,采用多层次采样策略生成晶圆图案,覆盖了从纳米级特征到宏观布局的全尺度范围,并利用严格的光学仿真引擎确保数据物理准确性。数据集构建过程中特别注重工艺参数的多样性配置,包括曝光剂量、焦距变化等关键变量,以模拟真实半导体制造中的复杂场景。
特点
该数据集最显著的特征在于其前所未有的规模和多尺度特性,包含超过千亿级别的仿真数据点,为当前领域内规模最大的公开基准。数据维度涵盖光强分布、抗蚀剂轮廓和最终显影图形等关键输出,每个样本均附有完整的工艺参数标签。特别值得注意的是,数据集通过精心设计的噪声注入机制,真实再现了制造过程中的随机波动,为机器学习模型提供了极具挑战性的测试环境。不同尺度间的数据具有严格的空间对应关系,支持跨尺度联合建模研究。
使用方法
使用LithoSim数据集时,研究人员可通过GitHub仓库提供的标准化接口加载数据,该接口支持按工艺参数或空间尺度进行灵活筛选。数据集采用分层存储结构,允许用户根据计算资源情况选择不同规模的数据子集。典型应用场景包括但不限于:训练基于深度学习的快速光刻仿真模型、开发新型工艺补偿算法、以及评估不同机器学习架构在计算光刻任务中的表现。为便于复现研究结果,建议用户严格遵循项目文档中规定的数据划分方案,确保模型评估的公平性。
背景与挑战
背景概述
LithoSim数据集作为光刻仿真领域的重要基准,由研究团队在近年推出,旨在解决半导体制造中光刻工艺仿真的多尺度建模难题。该数据集依托Apache 2.0开源协议发布,其核心价值在于为混合机器学习方法提供了涵盖纳米至微米级特征的标准化测试平台。通过集成不同工艺节点的仿真数据,LithoSim有效填补了传统物理模型与数据驱动方法之间的鸿沟,为提升集成电路制造中的图案保真度预测精度奠定了数据基础。
当前挑战
LithoSim面临的首要挑战在于光刻仿真固有的多物理场耦合特性,需同步解决电磁场近远场效应、光阻化学反应等跨尺度建模问题。数据集构建过程中,研究人员需克服纳米级特征采样密度与宏观晶圆区域覆盖范围之间的平衡难题,同时确保不同工艺节点的数据具有可比性。此外,如何有效标注混合物理模型与机器学习预测结果的偏差,亦是该基准在算法验证环节需要持续优化的关键。
常用场景
经典使用场景
在半导体制造领域,LithoSim数据集为光刻工艺模拟提供了多尺度混合建模的基准平台。该数据集通过整合物理模型与机器学习方法,能够精确模拟从纳米级到微米级的光刻成像过程,成为评估新型光刻算法性能的黄金标准。研究人员利用其丰富的参数配置和真实工艺数据,可系统性地验证不同计算光刻技术的成像保真度与计算效率。
解决学术问题
LithoSim有效解决了光刻仿真中多物理场耦合建模的精度瓶颈问题。通过提供包含电磁场、光化学反应的跨尺度数据,该数据集使研究人员能够突破传统有限元方法的计算限制,探索基于深度学习的代理模型在复杂工艺仿真中的应用潜力。其标准化评估框架显著提升了不同研究团队在计算光刻领域的成果可比性。
衍生相关工作
基于LithoSim的基准研究已催生多项创新成果,包括采用图神经网络的光刻热点检测算法、基于物理约束的生成对抗网络用于掩模优化等。IEEE Transactions on Semiconductor Manufacturing收录的混合建模框架研究,以及SPIE Advanced Lithography会议系列中的多篇论文均以该数据集作为核心验证平台。
以上内容由遇见数据集搜集并总结生成



