five

PCB-Bench

收藏
github2026-03-03 更新2026-03-18 收录
下载链接:
https://github.com/digailab/PCB-Bench
下载链接
链接失效反馈
官方服务:
资源简介:
PCB-Bench是第一个全面的基准数据集,旨在系统地评估(多模态)大型语言模型(LLMs/MLLMs)在PCB布局和布线推理中的表现。它通过将文本、图像和真实PCB设计工件整合到一个统一的评估框架中,解决了缺乏标准化基准和高保真数据集的问题。数据集包含三个互补的任务设置:1) 基于文本的推理(文本到文本问答和选择题),2) 多模态图像-文本推理(图像和文本问答/选择题),3) 真实世界PCB设计理解(PCB设计理解)。

PCB-Bench is the first comprehensive benchmark dataset designed to systematically evaluate the performance of (multimodal) large language models (LLMs/MLLMs) in PCB layout and routing reasoning. It addresses the scarcity of standardized benchmarks and high-fidelity datasets by integrating text, images, and real-world PCB design artifacts into a unified evaluation framework. The dataset includes three complementary task settings: 1) Text-based reasoning (text-to-text question answering and multiple-choice questions), 2) Multimodal image-text reasoning (image and text based question answering/multiple-choice questions), 3) Real-world PCB design understanding (PCB design understanding).
创建时间:
2026-02-28
原始信息汇总

PCB-Bench 数据集概述

数据集简介

PCB-Bench 是首个用于系统性评估(多模态)大语言模型在印刷电路板布局与布线方面能力的综合基准。它通过整合文本、图像和真实的PCB设计工件,解决了现实PCB工程推理中缺乏标准化基准和高保真数据集的问题。

包含内容

PCB-Bench 包含三个互补的任务设置及相应数据集:

1. 基于文本的推理

  • 1,800 个专家编写的自由形式问答实例。
  • 每个问答都有对应的单项选择题版本。
  • 总计约 3,700 个问题。
  • 涵盖元件放置布线策略设计规则合规性
  • 涵盖布局和布线中的宏观层面微观层面,并带有主题标签。

2. 多模态图文推理

  • 500 个需要联合解读PCB布局图像技术提示的问题。
  • 包括选择题填空式完形填空自由形式问答
  • 涵盖视觉语义子任务,如元件识别、功能块识别、走线推理、过孔存在性检查、差分对连续性分析等。

3. 真实PCB设计理解

  • OSHWHub收集了174个完整的真实世界PCB项目。
  • 每个设计包含原理图布局/布线文件设计描述元件库EDA软件截图等工件。
  • 任务设置:给定一个独立的EDA编辑器截图,模型生成关于电路板功能/结构/应用场景的自由形式描述

任务制定

PCB-Bench 按照真实工程工作流程组织为三个任务设置:

  • 任务1:文本到文本的问答与选择题
  • 任务2:图像与文本的多模态问答与选择题
  • 任务3:PCB设计理解

评估协议

所有模型均在统一的零样本设置下进行评估。

评估指标

  • 选择题:Top-1 准确率
  • 自由形式问答:使用BERTScoreSentence-BERT相似度评估与参考答案的语义一致性。
  • 任务3:额外报告精确率/召回率/F1分数

数据来源与许可

  • PCB设计收集自公开可用且合法访问的来源,不涉及专有或敏感的工业数据。
  • 真实PCB项目收集自OSHWHub
  • PCB-Bench 以开放许可发布。

引用

如需在研究中引用PCB-Bench,请使用提供的BibTeX条目。

搜集汇总
数据集介绍
main_image_url
构建方式
在电子设计自动化领域,PCB-Bench作为首个系统性评估大语言模型在印刷电路板布局与布线任务中的基准,其构建过程体现了严谨的工程化思维。数据集通过整合多模态信息源,精心构建了三个互补的任务模块:文本推理部分包含约1800个专家撰写的开放式问答及对应的单项选择问题,总计约3700个问题,覆盖从宏观设计原则到微观实现细节的广泛主题;多模态图文推理部分包含约500个需结合PCB布局图像与技术提示进行解答的问题,涵盖选择题、填空题及开放式问答等多种形式;真实PCB设计理解部分则收集了174个来自OSHWHub平台的完整PCB项目,包含原理图、布局布线文件、设计描述等全套工程文件。这种分层构建方式确保了数据集既能评估抽象知识推理,又能检验对实际设计工件的结构化视觉解读能力。
特点
PCB-Bench的突出特点在于其开创性地将印刷电路板工程领域的专业评估体系化。数据集首次实现了文本、图像与真实PCB设计工件在多任务框架下的有机融合,构建了从纯文本推理到多模态理解再到真实场景解读的渐进式评估维度。其问题设计深度覆盖了元件布局、布线策略、设计规则合规性等核心工程议题,并细分为信号完整性、电磁兼容、电源规划、差分对、可制造性设计等专业标签。特别值得关注的是,数据集引入的EDA工具截图描述任务,要求模型仅凭单张编辑器界面图像生成对电路板功能、结构与应用场景的自由描述,这种设置高度模拟了工程师在实际工作中对设计文件的快速解读场景,为评估模型在专业视觉语义理解方面的能力提供了独特视角。
使用方法
该数据集的使用遵循标准化的零样本评估协议,所有模型均在统一设置下独立回答每个问题实例,无需演示或微调过程。对于选择题型任务,采用Top-1准确率作为核心评估指标;开放式问答任务则通过BERTScore和Sentence-BERT相似度来衡量生成答案与参考答案的语义一致性;在PCB设计理解任务中,额外引入精确率、召回率与F1分数等多维度指标,以全面捕捉预测质量的不同侧面。研究人员可通过项目公开的评估脚本与配置文件复现论文结果,数据集的开源许可特性支持学术界与工业界进行标准化比较研究。这种设计既保证了评估的公平性与可重复性,又为后续研究提供了可扩展的基准框架。
背景与挑战
背景概述
在集成电路与电子系统设计领域,印刷电路板(PCB)的布局与布线是决定电路性能、可靠性与制造成本的核心环节。随着人工智能技术的演进,尤其是大语言模型与多模态模型在专业工程任务中展现出潜力,如何系统评估这些模型在PCB设计中的推理能力成为一个亟待探索的前沿课题。PCB-Bench应运而生,由Digailab等研究团队于2026年提出,并发表于ICLR会议,旨在填补PCB工程推理领域缺乏标准化基准与高保真数据集的空白。该数据集整合文本、图像及真实PCB设计工件,构建了首个全面评估大模型在PCB布局与布线任务中性能的基准,为推动智能电子设计自动化(EDA)工具的发展提供了关键的数据基础与评估框架。
当前挑战
PCB-Bench所针对的领域挑战在于PCB布局与布线本身是一项高度复杂、多约束的工程优化问题,涉及信号完整性、电磁兼容、热管理及可制造性等多重因素的权衡,要求模型具备深层次的领域知识与空间推理能力。构建过程中的挑战则体现在数据采集与标注的复杂性:需要从公开资源如OSHWHub中收集大量真实PCB项目,并确保数据合法性与透明度;同时,创建涵盖文本问答、多模态图像-文本推理及完整设计理解的多任务评估体系,要求专家进行精细的问题设计与答案标注,以覆盖从宏观设计原则到微观实施细节的广泛主题,并建立可靠的语义相似度评估指标,以准确衡量模型生成内容的专业性。
常用场景
经典使用场景
在电子设计自动化领域,PCB-Bench作为首个综合性基准测试,其经典使用场景聚焦于评估多模态大语言模型在印刷电路板布局与布线任务中的推理能力。该数据集通过整合文本、图像及真实PCB设计工件,构建了一个统一评估框架,使研究者能够系统性地测试模型在组件放置、布线策略及设计规则合规性等方面的专业知识。典型应用包括利用文本问答任务检验模型对宏观设计原则与微观实现细节的理解,以及通过图像文本多模态任务评估模型对PCB布局图的视觉语义解析能力。
衍生相关工作
围绕PCB-Bench数据集,已衍生出多项经典研究工作,特别是在领域自适应大语言模型的开发与评估方面。研究团队基于Qwen2.5-7B-Instruct等模型构建了PCB专用变体,探索了专业知识注入对模型性能的影响。这些工作不仅验证了多模态模型在专业工程场景中的潜力,也为后续研究提供了可复现的评估协议与基线,推动了电子设计自动化与人工智能融合领域的算法创新与基准标准化。
数据集最近研究
最新研究方向
在电子设计自动化领域,PCB-Bench作为首个针对印刷电路板布局与布线任务的大语言模型综合基准,正引领着该领域的前沿研究方向。该数据集通过整合文本、图像及真实PCB设计工件,构建了多模态评估框架,旨在系统评测模型在信号完整性、电磁兼容性等专业场景下的工程推理能力。其涵盖的文本问答、图文交互及真实设计理解三大任务,紧密关联当前工业界对智能化设计工具的需求热点,推动了人工智能与硬件设计交叉领域的标准化进程。这一基准的建立不仅为模型性能提供了可复现的衡量标准,更促进了生成式人工智能在复杂工程决策中的应用深化,对提升设计效率与可靠性具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作