OpenLS-D

Name: OpenLS-D
Creator: 中国科学院计算技术研究所
Published: 2024-11-14 21:18:06
License: 暂无描述

arXiv2024-11-14 更新2024-11-16 收录

下载链接：

https://github.com/LogicFactory/ACE/blob/master/OpenLS-D/readme.md

下载链接

链接失效反馈

官方服务：

资源简介：

OpenLS-D是由中国科学院计算技术研究所等机构创建的逻辑综合数据集，旨在支持机器学习在逻辑综合过程中的应用。该数据集包含46个组合设计，总计超过966,000个布尔电路，每个设计包含21,000个电路，由1,000个综合配方生成。数据集创建过程包括布尔表示、逻辑优化和技术映射三个基本步骤，并支持半定制化，允许研究人员添加步骤和逐步细化生成的数据集。OpenLS-D的应用领域广泛，包括电路分类、电路排名、质量结果预测和概率预测等，旨在解决逻辑综合中的多样化问题。

OpenLS-D is a logic synthesis dataset developed by institutions including the Institute of Computing Technology, Chinese Academy of Sciences, aiming to support the application of machine learning in logic synthesis processes. This dataset includes 46 combinational designs, with a total of over 966,000 Boolean circuits. Each design comprises 21,000 circuits generated via 1,000 synthesis recipes. The creation process of the dataset involves three core steps: Boolean representation, logic optimization, and technology mapping. It also supports semi-customization, allowing researchers to add custom steps and iteratively refine the generated dataset. OpenLS-D has a wide range of application scenarios, including circuit classification, circuit ranking, quality-of-result prediction, and probabilistic prediction, aiming to address diverse challenges in logic synthesis.

提供机构：

中国科学院计算技术研究所

创建时间：

2024-11-14

搜集汇总

数据集介绍

构建方式

OpenLS-D数据集的构建基于一个自适应的开源数据生成框架，旨在增强逻辑合成过程中的机器学习应用。该框架涵盖了逻辑合成的三个基本步骤：布尔表示、逻辑优化和技术映射。通过将中间文件存储为Verilog和GraphML格式，保留了原始信息，并允许研究人员添加步骤以逐步完善生成的数据集。此外，框架还包括一个自适应电路引擎，用于加载GraphML文件以进行最终数据集打包和子数据集提取。生成的OpenLS-D数据集包含46个来自成熟基准的组合设计，总计超过966,000个布尔电路，每个设计包含21,000个电路，这些电路由1000个合成配方生成，包括7000个布尔网络、7000个ASIC网表和7000个FPGA网表。

使用方法

OpenLS-D数据集的使用方法多样，适用于多种下游任务，如电路分类、电路排序、质量结果（QoR）预测和概率预测。每个任务通过电路引擎从OpenLS-D数据集中提取和重新标记数据集。例如，电路分类任务可以通过加载数据集中的布尔电路和相应的标签进行训练，而QoR预测任务则需要加载未优化的布尔电路、优化序列和归一化的QoR数据。通过这些方法，研究人员可以利用OpenLS-D数据集进行广泛的实验和模型训练，从而推动逻辑合成领域的发展。

背景与挑战

背景概述

OpenLS-D数据集由中科院计算技术研究所、鹏城实验室和北京大学等多家机构的研究人员共同开发，旨在为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。OpenLS-D数据集的创建不仅填补了现有数据集在任务适应性和集成机器学习能力方面的空白，还通过包含46个组合设计的基准测试，总计超过966,000个布尔电路，展示了其在电路分类、电路排序、质量结果预测和概率预测等多项下游任务中的广泛应用性。

当前挑战

OpenLS-D数据集面临的挑战主要集中在两个方面。首先，逻辑综合领域的复杂性要求数据集能够支持多样化的机器学习任务，这需要在数据集生成过程中处理大量的布尔电路和优化序列，确保数据集的多样性和适应性。其次，数据集的构建过程中需要解决布尔电路的转换和优化问题，确保中间文件的原始信息得以保留，并能够在Verilog和GraphML格式之间进行半定制化处理。此外，数据集还需要支持新数据特征的集成，以应对不断出现的新挑战。

常用场景

经典使用场景

OpenLS-D数据集在逻辑综合领域中被广泛应用于机器学习任务的增强。其经典使用场景包括电路分类、电路排序、质量结果（QoR）预测和概率预测。这些任务通过从OpenLS-D数据集中提取和重新标记的数据集来实现，利用电路引擎进行数据集的提取和包装。实验结果表明，该数据集具有多样性和广泛适用性，能够支持多种逻辑综合任务。

解决学术问题

OpenLS-D数据集解决了逻辑综合领域中缺乏全面和可靠数据集的问题。通过提供一个适应性强、支持多种机器学习任务的数据集生成框架，OpenLS-D使得研究人员能够在逻辑优化、技术映射和形式验证等不同方面进行深入研究。这不仅提高了逻辑综合步骤的效率和质量，还为开发新的EDA工具和方法提供了坚实的基础。

实际应用

在实际应用中，OpenLS-D数据集被用于开发和验证各种逻辑综合算法和模型。例如，在电路设计自动化流程中，该数据集可以用于训练机器学习模型，以优化电路的布线和布局。此外，OpenLS-D还可以用于评估新算法在不同设计类型和类别上的性能，从而确保其在实际应用中的有效性和可靠性。

数据集最近研究