Therm-FM datasets
收藏arXiv2026-05-22 更新2026-05-23 收录
下载链接:
https://github.com/haiyangxin/Therm-FM
下载链接
链接失效反馈官方服务:
资源简介:
Therm-FM数据集由东方理工学院等研究机构联合创建,旨在支持三维集成电路热模拟的深度学习研究。该数据集包含公开HotSpot基准测试和工业级3D-IC封装案例,涵盖不同芯片结构、空间分辨率及稳态/瞬态热分析任务,数据通过高保真有限元仿真和热等效模型生成,有效降低了数据获取成本。数据集通过多保真度训练策略构建,融合了低成本近似仿真与稀疏高保真样本,为热场预测提供了多尺度物理特征。该数据集主要应用于芯片热管理优化领域,解决了传统热模拟方法计算成本高、跨设计迁移能力弱的核心问题,为基于预训练物理先验的神经网络算子提供了标准化评估基准。
Therm-FM dataset was co-developed by the Oriental Institute of Technology and other research institutions, aiming to support deep learning research for thermal simulation of three-dimensional integrated circuits (3D ICs). This dataset includes publicly available HotSpot benchmark tests and industrial-grade 3D-IC packaging cases, covering diverse chip architectures, spatial resolutions, and steady-state/transient thermal analysis tasks. The data is generated through high-fidelity finite element simulation and thermal equivalent models, effectively lowering the cost of data acquisition. Constructed via a multi-fidelity training strategy, the dataset integrates low-cost approximate simulations and sparse high-fidelity samples, providing multi-scale physical features for thermal field prediction. Primarily applied in the field of chip thermal management optimization, this dataset addresses the core problems of traditional thermal simulation methods, including high computational costs and poor cross-design transferability, and serves as a standardized evaluation benchmark for neural network operators based on pre-trained physical priors.
提供机构:
中国科学技术大学·计算机科学与技术学院; 东方理工学院; 清华大学; 谢菲尔德大学; 东方理工学院·宁波数字孪生研究院
创建时间:
2026-05-22
原始信息汇总
Therm-FM 数据集概述
基本信息
- 数据集地址:https://github.com/haiyangxin/Therm-FM
数据集描述
该数据集目前仅提供了名称“Therm-FM”,暂无其他详细信息。具体内容有待仓库作者进一步补充。
搜集汇总
数据集介绍

构建方式
三维集成电路(3D-IC)的热模拟在电子设计自动化中至关重要,然而传统基于有限元的方法耗时巨大。Therm-FM数据集为此而生,其构建根植于热传导与扩散型偏微分方程在算子层面的结构等价性。研究团队从公共HotSpot基准与工业级3D-IC封装案例出发,生成了涵盖稳态与瞬态场景的多样化温度场数据。特别地,数据集采用热等效多保真度训练策略:利用有效介质理论将密集的硅通孔与微凸点阵列均质化为宏观各向异性层,以产生低成本低保真度近似数据;同时结合少量高保真有限元模拟结果进行校准。这一策略显著降低了高保真数据的生成开销,为跨芯片设计的高效热模拟奠定了数据基础。
使用方法
Therm-FM数据集的使用高度适配预训练-微调范式。用户可将功率分布、材料结构信息及可选时间条件作为输入,通过预训练的偏微分方程基础模型与轻量级嵌入和恢复层,高效预测温度场。在操作上,模型首先利用热等效模型生成的低保真数据进行域适应,随后以少量高保真样本精调校准。实验证明,仅需500至1000个训练样本即可超越先前最优方法的全量数据基线;在跨芯片迁移场景中,10至30个微调样本便能取得显著提升。所有数据、源代码与预训练权重均已开源,便于研究者复现与扩展。
背景与挑战
背景概述
三维集成电路(3D-IC)凭借其高集成度与卓越性能,已成为后摩尔时代芯片设计的重要发展方向。然而,随着芯片堆叠层数增加与异构集成密度提升,热管理问题日益严峻,精确且高效的热仿真成为3D-IC设计流程中不可或缺的关键环节。传统有限元方法虽能提供高保真度解,但每次评估耗时数分钟至数小时,难以满足设计空间探索中成百上千次迭代的需求。在此背景下,由黄震、辛海洋等研究者于2026年提出的Therm-FM数据集与框架,开创性地将预训练的偏微分方程基础模型应用于3D-IC热仿真,通过识别芯片传热与扩散型PDE在算子层面的结构等价性,实现了跨芯片架构的高效热场预测,为数据驱动的电子设计自动化开辟了新范式。
当前挑战
Therm-FM数据集面临的核心挑战源于3D-IC热仿真的双重复杂性。一方面,传统学习型热代理模型需针对每个芯片设计从零训练,依赖大量高保真有限元仿真数据,导致高昂的数据生成成本与跨设计复用困难;芯片结构、材料属性或工况的变更均需重新生成数据并训练模型。另一方面,三维集成电路本身包含异质材料、密集硅通孔与微凸点互连、多层堆叠封装结构及工程级边界条件,多尺度耦合使得精确建模极为困难。为此,Therm-FM创新性地引入热等效多保真度训练策略,利用低成本近似仿真进行热域适应,仅需少量高保真样本校准,在保持精度同时将数据生成成本降低约74.7%,并实现最高10.6倍的平均误差缩减。
常用场景
经典使用场景
Therm-FM数据集在三维集成电路热仿真领域开辟了崭新的应用范式。该数据集的核心价值在于为基于物理信息驱动的神经网络算子提供训练与验证基准,将芯片级热传导问题转化为可迁移的偏微分方程学习任务。通过整合公共HotSpot基准测试与工业级3D-IC封装案例,该数据集支持从稳态到瞬态的多尺度热场预测,尤其适用于异构材质、密集硅通孔/微凸点互连以及多层堆叠封装结构下的温度场重建。研究者可利用该数据集训练端到端的热代理模型,实现从功率分布到温度场的快速映射,彻底颠覆传统有限元方法冗长的求解流程。
解决学术问题
Therm-FM数据集系统性地解决了学习型热仿真中长期存在的跨设计泛化瓶颈。传统数据驱动方法需为每个芯片设计从头生成高保真训练数据,导致高昂的数据采集成本与重复训练负担。该数据集通过引入预训练的偏微分方程基础模型,验证了热传导方程与扩散型算子之间的结构等价性,使扩散物理先验能直接迁移至芯片热场预测。此外,基于热等效模型的多保真度训练策略,显著降低了高保真有限元数据的依赖,在保持精度的同时将数据生成成本压缩超过70%。这些创新为3D-IC热仿真中的数据效率与跨架构泛化提供了理论支撑与实证依据。
实际应用
在实际电子设计自动化流程中,Therm-FM数据集展现出重要的工程应用价值。它支持芯片设计者在物理原型制造前快速评估不同架构的热性能,在五分钟内完成传统求解器耗时数小时的热分析任务。该数据集特别适用于需要反复执行热仿真的设计空间探索场景,如核心数量配置优化、电源方案权衡以及封装层材料选择。通过多保真度训练策略,工程师可利用低成本近似仿真数据完成模型粗调,仅需少量高精度样本进行校准,大幅缩短产品开发周期。当前数据集已集成工业级8核与32核封装案例,可直接服务于实际芯片项目的热管理决策。
数据集最近研究
最新研究方向
在当前三维集成电路热管理研究的前沿,Therm-FM数据集推动了基于偏微分方程基础模型的热仿真范式革新。该研究首次揭示了芯片热传导与扩散型偏微分方程在算子层面的结构等价性,并以此为基础,利用预训练的扩散先验知识,通过轻量级微调实现跨芯片架构的快速热场预测。这一方向与工业界对高能效、低成本电子设计自动化的迫切需求紧密呼应,尤其是在异构集成和芯粒技术高速发展的背景下,Therm-FM通过多保真度训练策略,显著降低了对高保真有限元数据的依赖,仅需传统方法20%的训练样本即可超越当前最优精度。该数据集的开放发布为三维集成电路热仿真领域树立了新的基准,为后续的迁移学习、少样本学习及物理信息驱动的基础模型研究提供了关键支撑。
相关研究论文
- 1Therm-FM: Foundation Model is ALL YOU NEED for 3D-ICs Thermal Simulation中国科学技术大学·计算机科学与技术学院; 东方理工学院; 清华大学; 谢菲尔德大学; 东方理工学院·宁波数字孪生研究院 · 2026年
以上内容由遇见数据集搜集并总结生成



