硬件设计数据集
收藏arXiv2024-10-09 更新2024-10-11 收录
下载链接:
https://benchmark-for-dgrl-in-hardwares.readthedocs.io/en/latest/
下载链接
链接失效反馈官方服务:
资源简介:
硬件设计数据集由佐治亚理工学院创建,包含五个硬件设计任务的数据集,涵盖了从高层次综合到物理综合的不同电路抽象级别。数据集大小从10k+到50k+节点不等,主要用于预测硬件性能和资源使用。数据集的创建过程结合了现有的研究成果,并通过预处理使其与PyTorch Geometric兼容。该数据集主要应用于硬件设计和机器学习领域,旨在通过图表示学习技术加速硬件评估和设计优化。
The hardware design dataset, developed by the Georgia Institute of Technology, encompasses datasets for five hardware design tasks covering diverse circuit abstraction levels ranging from high-level synthesis to physical synthesis. With sizes varying from 10k+ to 50k+ graph nodes, this dataset is primarily utilized for predicting hardware performance and resource utilization. Its creation process incorporates existing research outcomes, and it has been preprocessed to be compatible with PyTorch Geometric. Targeted at the fields of hardware design and machine learning, this dataset aims to accelerate hardware evaluation and design optimization through graph representation learning technologies.
提供机构:
佐治亚理工学院
创建时间:
2024-10-09
搜集汇总
数据集介绍

构建方式
该数据集通过收集五个硬件设计数据集,涵盖了13个预测任务,跨越了电路抽象的不同层级。数据集规模庞大,图的大小从每图400+节点扩展到10k+图,适用于图级任务,以及每图50k+节点,适用于节点级任务。数据集的构建采用了模块化预处理接口,使其兼容PyTorch Geometric,方便与DGRL方法集成。
特点
数据集的特点在于其广泛性和多样性,涵盖了数字和模拟硬件,以及不同电路抽象层级的数据。此外,数据集还包括了训练和测试数据分布偏移的情况,以模拟生产中可能遇到的OOD挑战。数据集的另一个特点是它的模块化代码库,使得硬件从业者能够评估所有21个DGRL模型,并允许ML研究人员使用收集的硬件设计任务来推进DGRL方法。
使用方法
数据集的使用方法包括评估DGRL模型在不同硬件设计任务上的性能,以及开发新的DGRL模型。用户可以利用PyG兼容格式对数据进行处理,并使用模块化代码库进行模型配置和超参数自动调优。数据集还提供了模块化的预处理接口,方便用户将数据集与DGRL方法集成。
背景与挑战
背景概述
在当代计算系统中,硬件设计的复杂性不断提升,对设计质量的评估和优化显得尤为重要。传统的基于模拟的方法需要耗费大量时间才能达到所需的精度,这严重阻碍了硬件开发周期。为了解决这个问题,研究者们开始探索使用机器学习技术来评估硬件设计的性能。本研究提出了一个新的基准测试,包括五个硬件设计数据集和十三项预测任务,涵盖了电路抽象的不同层级。这些数据集用于评估二十一种有向图表示学习(DGRL)模型,这些模型基于多种图神经网络和图转换器(GTs),并通过为有向图定制的位置编码(PEs)进行增强。研究结果强调了双向(BI)消息传递神经网络(MPNNs)和鲁棒PEs对模型性能的显著提升。此外,还强调了提高DGRL模型在分布外(OOD)数据上的泛化能力的重要性。该基准测试的模块化代码库简化了硬件和机器学习实践者对DGRL模型进行评估的过程。
当前挑战
硬件设计数据集面临的挑战主要包括:1) DGRL模型在硬件设计领域中的应用仍处于早期阶段,缺乏综合性和用户友好的基准测试;2) 现有的DGRL研究主要集中在无向图上,而硬件设计数据通常是有向图,这导致现有的模型在硬件设计领域中的应用效果不佳;3) 硬件设计领域的数据通常具有独特的属性,如长距离方向和逻辑依赖性,这给DGRL模型的构建和应用带来了挑战;4) 硬件设计数据通常具有分布外(OOD)的数据,这对DGRL模型的泛化能力提出了更高的要求。
常用场景
经典使用场景
硬件设计数据集主要用于评估和比较不同硬件设计领域中的图表示学习模型。该数据集包含了五个硬件设计数据集和13个预测任务,涵盖了从高级到低级的电路抽象层次。通过对21个图表示学习模型进行评估,可以发现双向消息传递神经网络和稳定的位置编码可以显著提高模型性能。此外,该数据集还强调了提高模型在分布外数据上的泛化能力的重要性。
衍生相关工作
硬件设计数据集的发布和评估为图表示学习领域带来了新的研究方向和挑战。例如,研究人员可以探索更有效的位置编码方法、设计新的图神经网络模型,以及提高模型在分布外数据上的泛化能力。此外,该数据集还可以用于其他领域,例如社交网络分析、金融交易分析等,为这些领域的研究提供新的思路和方法。
数据集最近研究
最新研究方向
随着现代计算系统中设计复杂性的快速提升,有向图表示学习(DGRL)在硬件设计领域变得至关重要,尤其是在编码电路网表、计算图以及开发硬件性能预测的替代模型方面。本研究提出了一个新的基准,包括五个硬件设计数据集和13个预测任务,涵盖了电路抽象的不同层次。通过评估21个DGRL模型,本研究发现双向(BI)消息传递神经网络(MPNN)和鲁棒的定位编码(PE)可以显著提高模型性能。特别是,具有PE增强的图变换器(GTs)和BI-MPNN层交替的模型以及BI-图同构网络在13个任务中都超过了基线。此外,对分布外(OOD)性能的调查强调了提高DGRL模型OOD泛化能力的紧迫性。该基准的实现使用模块化代码库,简化了硬件和机器学习实践者对DGRL模型的评估。
相关研究论文
- 1A Benchmark on Directed Graph Representation Learning in Hardware Designs佐治亚理工学院 · 2024年
以上内容由遇见数据集搜集并总结生成



