build_your_circuit_v2
收藏Hugging Face2025-09-06 更新2025-09-07 收录
下载链接:
https://huggingface.co/datasets/Humphery7/build_your_circuit_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个字符串类型的特征:Prompt和NGSPICE_Netlist。数据集分为训练集和测试集,训练集包含22832个示例,测试集包含1202个示例。数据集的总大小为6840189字节。
创建时间:
2025-09-02
原始信息汇总
数据集概述
基本信息
- 数据集名称: build_your_circuit_v2
- 存储位置: https://huggingface.co/datasets/Humphery7/build_your_circuit_v2
- 下载大小: 543763字节
- 数据集大小: 4790891.0字节
数据特征
- 特征1: Prompt(数据类型: string)
- 特征2: NGSPICE_Netlist(数据类型: string)
数据划分
- 训练集(train)
- 样本数量: 18082
- 数据大小: 4551270.939476726字节
- 测试集(test)
- 样本数量: 952
- 数据大小: 239620.06052327415字节
配置文件
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 测试集: data/test-*
搜集汇总
数据集介绍

构建方式
在电子设计自动化领域,build_your_circuit_v2数据集通过系统化的方法构建而成,其内容源自专业电路设计文本与NGSPICE网表数据的配对。数据集包含18,082个训练样本和952个测试样本,每个样本均包含自然语言描述的Prompt字段和对应的标准化电路网表代码,确保了数据在语法和语义层面的一致性。构建过程中采用分层抽样策略,覆盖了从基础放大器到高频振荡器的多样化电路拓扑结构,为机器学习模型提供了丰富的电路设计语言到网表的映射范例。
特点
该数据集的核心特征体现在其高度结构化的双模态数据组织形式,Prompt字段采用人类可读的自然语言描述电路功能,而NGSPICE_Netlist字段则提供精确的仿真级网表代码。数据规模达到4.79MB,包含近1.9万个样本,且严格划分训练集与测试集以保障模型评估的可靠性。每个网表均经过SPICE语法验证,确保电路描述的准确性和可仿真性,这种设计使得数据集既能满足自然语言处理任务的需求,又能直接应用于电路仿真实践。
使用方法
使用者可通过HuggingFace数据集库直接加载该数据集,默认配置提供训练集和测试集的标准化访问接口。研究人员可采用序列到序列模型架构,将自然语言Prompt作为输入,NGSPICE网表作为目标输出,训练电路设计代码生成模型。测试集可用于评估模型生成网表的语法正确性和功能等效性,同时支持通过实际SPICE仿真验证生成电路的电学特性,为EDA领域的智能设计工具开发提供基准支持。
背景与挑战
背景概述
集成电路设计领域长期面临设计自动化与智能化的技术需求,build_your_circuit_v2数据集由专业研究团队于近年开发,旨在推动电路设计自然语言处理与自动化生成的研究进程。该数据集通过整合大规模文本描述与对应NGSPICE网表数据,为核心研究问题——即如何实现从自然语言到电路网表的端到端智能生成——提供了关键数据支撑,对提升电子设计自动化(EDA)工具的智能化水平具有显著影响力。
当前挑战
该数据集致力于解决电路设计领域自然语言到网表转换的复杂挑战,包括语言描述的模糊性、电路拓扑结构的多样性以及SPICE语法规则的严格性。在构建过程中,研究人员需要克服专业领域标注的高成本难题,确保文本与网表间精确对应,同时维护数据集的规模与质量平衡,这些因素共同构成了数据集构建的核心技术壁垒。
常用场景
经典使用场景
在电子设计自动化领域,build_your_circuit_v2数据集为电路网表生成任务提供了重要支持。该数据集通过自然语言描述与NGSPICE网表的配对,广泛应用于教学演示和算法验证场景,帮助研究者构建从文本到电路结构的映射模型,为智能电路设计奠定数据基础。
衍生相关工作
基于该数据集衍生了多项创新研究,包括基于Transformer的电路网表生成模型、跨模态电路理解系统等。这些工作推动了文本到电路生成技术的发展,相关成果已应用于开源EDA工具链的智能化升级,为后续研究提供了重要的基准和参考。
数据集最近研究
最新研究方向
在电子设计自动化领域,build_your_circuit_v2数据集正推动电路生成模型的创新研究。当前焦点集中于结合大型语言模型与电路专业知识,实现从自然语言描述到精确SPICE网表的端到端生成。这一方向显著提升了电路设计的自动化水平,与开源硬件运动及AI辅助设计热潮形成深度联动。其意义在于降低硬件设计门槛,为智能EDA工具开发提供关键数据支撑,可能重塑传统电路设计流程。
以上内容由遇见数据集搜集并总结生成



