iDATA
收藏Hugging Face2025-10-28 更新2025-10-29 收录
下载链接:
https://huggingface.co/datasets/AiEDA/iDATA
下载链接
链接失效反馈官方服务:
资源简介:
iDATA是一个专门为AI+EDA(电子设计自动化)应用设计的数据库。它包括三种基本数据类型:Net、Path和Graph。每种数据类型都详细描述了其文件路径、数据生成机制、数据结构示例、字段描述、数据用途和数据特征。Net数据提供了网络的几何和电气特性,支持时序分析、DRC检查、功耗估计、路由密度分析和机器学习模型训练。Path数据用于时序分析、信号完整性评估、功耗分析、路径可视化、时序收敛验证和机器学习模型训练。Graph数据表示芯片设计中网络的连接关系,便于基于图的分析和算法优化。该数据集以JSON格式存储,便于解析和处理,并采用GPL许可证。
创建时间:
2025-10-16
原始信息汇总
iDATA 数据集概述
数据集基本信息
- 数据集名称:iDATA
- 许可证:GPL
- 标签:AI + EDA dataset, skywater130 process
- 用途:训练AI模型用于设计PPA预测、PPA感知物理设计及相关任务
基础数据类型
1. Net数据
- 文件路径示例:
vectors/nets/net_0.json - 数据结构:JSON格式,包含网络完整连接信息
- 主要字段:
- 网络标识符(id、name)
- 几何特征(边界框坐标、尺寸、面积)
- 电气特征(电阻、电容、功耗)
- 时序特征(延迟、转换时间)
- 物理特征(线长、通孔数、DRC违规)
- 引脚信息(数量、位置、驱动属性)
- 线段信息(几何参数、电气参数)
- 布线图结构(顶点、边、路径)
2. Path数据
- 文件路径示例:
vectors/wire_paths/wire_path_1.json - 数据结构:JSON数组格式,按时序顺序组织
- 主要字段:
- 节点信息(位置、电容、转换时间、转换类型)
- 实例弧(单元内部传播延迟)
- 网络弧(网络传播延迟,包含详细线段信息)
3. Graph数据
- 文件路径示例:
vectors/wire_graph/timing_wire_graph.json - 数据结构:标准图数据结构
- 主要字段:
- 节点数组(引脚、端口和布线节点)
- 边数组(节点间连接关系)
数据特征
技术特征
- 工艺节点:SkyWater 130nm工艺
- 数据层次:从宏观边界框到微观线段细节的多层次信息
- 特征集成:几何、电气和时序特性的综合集成
- 阶段支持:布局和布线阶段的特征分析
格式特征
- 存储格式:JSON格式,便于解析和处理
- 处理模式:支持批处理模式
- 结构完整:提供完整的布线图结构,支持基于图的分析
应用场景
物理设计分析
- 网络的几何和电气特性分析
- 布线密度和拥塞分析
- DRC检查和违规分析
时序分析
- 关键参数分析(电阻、电容、延迟、转换时间)
- 时序收敛验证
- 信号完整性评估
功耗分析
- 功耗估计和优化
- 基于节点电容和翻转率的动态功耗计算
机器学习应用
- 网络性能预测模型训练
- 路径延迟和信号完整性问题预测
- 算法优化支持
数据生成机制
基础构建
- 调用
Vectorization::buildFeature函数 - 通过
buildLayoutData和buildGraphData构建基础数据 - 使用
generateFeature生成网络特征
时序分析
- 执行
eval_tp->runVecSTA()进行详细时序分析 - 通过
reportWirePaths()函数生成详细路径数据
数据保存
- 通过
_data_manager.saveData方法保存数据 - 使用
VecLayoutFileIO::saveJsonNets方法保存网络数据
搜集汇总
数据集介绍

构建方式
在电子设计自动化领域,iDATA数据集通过系统化流程构建而成,其基础数据生成机制调用Vectorization模块的buildFeature函数,整合buildLayoutData与buildGraphData构建布局与图结构数据。通过generateFeature方法提取时序特征、DRC特征及统计特征,最终经由_data_manager.saveData实现数据序列化,支持单文件与批量处理模式,形成标准化的JSON格式存储体系。
使用方法
该数据集适用于人工智能驱动的电子设计自动化任务,通过解析JSON格式的Net、Path与Graph数据结构,可提取几何特征与电气参数进行时序分析。用户可基于路由图结构实施布线密度评估,利用时序路径数据训练PPA预测模型,或通过DRC特征集进行设计规则检查。数据集支持端到端工作流,为物理设计优化与机器学习模型训练提供标准化输入。
背景与挑战
背景概述
在电子设计自动化领域,iDATA数据集作为AI+EDA交叉研究的代表性成果,聚焦于集成电路物理设计阶段的性能预测与优化。该数据集基于SkyWater 130nm工艺节点构建,通过系统化采集布线网络的几何特征、电气参数与时序特性,为机器学习模型提供多维度训练数据。其核心价值在于打通传统EDA工具与人工智能方法之间的数据壁垒,通过标准化JSON格式实现网表数据、路径时序与布线图结构的统一表征,显著提升了设计空间探索的效率与精度。
当前挑战
该数据集需解决物理设计中的多目标优化难题:如何在功耗、性能与面积相互制约的复杂关系中实现精准预测。构建过程中面临三维布线数据的抽象表征挑战,包括非曼哈顿路径的图结构转换、时序弧延迟的增量计算,以及金属层间寄生参数的分布式建模。此外,数据生成流程需协调布局规划与静态时序分析的多工具链协作,确保特征提取与电路实际物理效应的一致性。
常用场景
经典使用场景
在电子设计自动化领域,iDATA数据集为人工智能驱动的物理设计优化提供了关键支撑。其核心应用场景聚焦于训练深度学习模型进行PPA(性能、功耗、面积)指标预测,通过解析布线网络的几何特征与电气参数,构建从布局规划到时序收敛的端到端分析框架。该数据集通过标准化特征工程,将传统EDA工具链中的物理设计知识转化为可量化的机器学习特征,为芯片设计自动化开辟了新范式。
解决学术问题
该数据集有效解决了集成电路物理设计中的多目标优化难题。通过提供精确的时序路径延迟、信号完整性参数和布线拥塞特征,使研究人员能够建立高精度的PPA预测模型。其价值在于将传统基于经验规则的优化过程转化为数据驱动的科学方法,显著提升了设计收敛效率,并为解决纳米级工艺下的互连线效应、工艺变异等前沿问题提供了基准数据。
实际应用
在实际芯片设计流程中,iDATA支撑着智能布局布线系统的开发。设计团队可利用其训练得到的预测模型,在物理实现阶段快速评估不同方案的质量,显著缩短设计周期。基于SkyWater 130nm工艺的标准化特征体系,使得该数据集可直接应用于工业级EDA工具的智能插件开发,实现从传统试错式优化到预测性设计的范式转变。
数据集最近研究
最新研究方向
在电子设计自动化领域,iDATA数据集凭借其覆盖SkyWater 130nm工艺的PPA参数与物理设计特征,正推动人工智能与芯片设计深度融合。当前研究聚焦于利用图神经网络解析布线拓扑结构,通过时序路径的延迟预测模型优化信号完整性。该数据集支撑的功耗-性能-面积协同分析成为行业热点,尤其在异构集成与先进工艺节点中,为自动驾驶芯片等高算力场景提供关键训练数据。其多维特征融合机制正催生新一代智能布局布线算法,显著提升设计收敛效率与芯片能效比。
以上内容由遇见数据集搜集并总结生成



