asap7-language-of-test
收藏Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/chrivasileiou/asap7-language-of-test
下载链接
链接失效反馈官方服务:
资源简介:
ASAP7语言测试数据集提供了使用ASAP7 7纳米工艺库合成的电路的门级结构化Verilog网表、ATPG生成的测试模式、故障检测结果以及设计级统计数据。该数据集旨在支持对“测试语言”的研究,即 netlist结构、故障位置和区分测试激励之间的关系形成一个可学习的符号系统,现代AI模型可以访问该系统。数据集来源于真实的RTL设计,通过行业级流程合成和验证。
创建时间:
2025-11-19
原始信息汇总
ASAP7 Language of Test 数据集概述
数据集简介
该数据集提供基于ASAP7 7nm PDK(RVT,TT corner)合成的门级结构Verilog网表、ATPG生成的测试模式、故障检测结果和设计级统计信息,专门用于支持"测试语言"研究。
核心特征
- 数据来源:源自现实RTL设计,通过工业级流程(Synopsys DC、Formality、TetraMAX)合成和验证
- 技术节点:ASAP7 7nm工艺
- 故障模型:固定型故障(sa0/sa1)
- 设计类型:组合逻辑设计(当前版本不包含时序设计)
数据内容
主要组成部分
- 门级结构Verilog网表
- ATPG生成的测试模式
- 故障检测结果
- 设计级统计信息
数据生成流程
- 综合:使用Synopsys Design Compiler
- 等价性检查:使用Synopsys Formality
- ATPG与故障模拟:使用Synopsys TetraMAX
- 数据聚合:合并为单个CSV文件
数据架构
CSV文件结构
| 字段名 | 类型 | 描述 |
|---|---|---|
| module_name | 字符串 | RTL模块名称 |
| netlist_only_gates | 字符串 | 仅包含单元实例的结构Verilog网表 |
| patterns | 字符串 | ATPG生成的测试模式(编码文本形式) |
| faults | 字符串 | 检测到的故障及其位置列表 |
| atpg | 字符串 | TetraMAX ATPG报告或摘要 |
| netlist | 字符串 | 完整结构Verilog网表 |
| num_instances | 整数 | 标准单元实例数量 |
| num_wires | 整数 | Verilog线网声明数量 |
| num_inputs | 整数 | 主要输入数量 |
| num_outputs | 整数 | 主要输出数量 |
关联数据集
- 源设计:基于FreeSet-V1.0-LabUse数据集(https://huggingface.co/datasets/SETH-TAMU/FreeSet-V1.0-LabUse)
- 处理流程:FreeSet → ASAP7综合 → 门级网表 → ATPG模式 + 故障检测
使用限制
- 仅包含ASAP7 RVT/TT工艺角
- 仅考虑固定型故障
- 当前版本不包含时序设计
- ATPG文本字段需要解析才能直接训练
许可信息
- 许可证:Apache 2.0
引用要求
使用本数据集需同时引用原始论文和数据集本身。
搜集汇总
数据集介绍

构建方式
在集成电路测试研究领域,本数据集通过工业级工具链构建而成。原始设计源自FreeSet项目提供的无版权RTL模块,采用Synopsys Design Compiler基于ASAP7 7纳米PDK进行逻辑综合,生成门级结构网表。通过Formality进行等效性验证确保功能一致性,再利用TetraMAX执行针对固定型故障的ATPG测试生成与故障模拟,最终将网表结构、测试向量与故障检测结果整合为结构化数据。
特点
该数据集显著特点在于其工业实践相关性,所有电路均来自真实RTL设计而非随机生成。数据集完整呈现了从RTL到门级网表的转换过程,包含标准单元映射后的结构特征与测试覆盖率信息。其多维数据架构同时提供网表拓扑、测试激励模式及故障定位的对应关系,为研究测试语言符号系统提供了真实场景下的学习样本。
使用方法
研究人员可通过Hugging Face数据集库直接加载该资源,利用Python接口获取结构化数据。数据集支持对门级网表进行自然语言处理建模,可将测试模式生成视为序列到序列的学习任务。典型应用场景包括训练大语言模型理解网表结构与测试响应的内在关联,或开发基于AI的测试向量生成算法,但需注意时序电路与故障模型的当前限制条件。
背景与挑战
背景概述
在集成电路测试领域,2025年由Christos Vasileiou与Yiorgos Makris团队构建的ASAP7测试语言数据集,标志着人工智能与硬件验证融合的新里程碑。该数据集基于ASAP7纳米工艺设计套件,通过工业级工具链将真实寄存器传输级设计转化为门级结构网表,填补了传统合成电路无法反映实际设计实践的空白。其核心价值在于将网表结构、故障定位与测试激励的关联关系建模为可学习的符号系统,为大型语言模型在自动测试模式生成领域的应用提供了实证基础。
当前挑战
该数据集需攻克两大核心难题:其一,在领域问题层面,如何使语言模型理解门级网表与故障检测间的复杂映射关系,突破传统测试生成方法对人工规则的依赖;其二,在构建过程中,需协调Synopsys工具链完成从RTL综合到故障模拟的全流程,确保工业级精度与版权合规性。此外,当前版本受限于单工艺角与组合电路覆盖,且原始文本字段的解析复杂度对模型训练构成额外挑战。
常用场景
经典使用场景
在集成电路测试领域,ASAP7数据集为研究门级结构网表与测试模式之间的关联性提供了关键实验平台。其经典应用场景聚焦于利用现代人工智能模型学习故障检测的符号化系统,通过分析真实RTL设计合成的结构网表、ATPG生成的测试向量及故障覆盖数据,探索测试语言的可学习性。该数据集突破了传统合成电路的局限性,为验证AI驱动测试生成方法的有效性奠定了实证基础。
衍生相关工作
该数据集催生了多项创新性研究,其中最具代表性的是《Teaching Llamas to Test》提出的语言模型测试生成框架。基于此数据构建的衍生工作进一步探索了Transformer架构在故障诊断中的应用,推动了神经网络与形式化验证方法的融合。这些研究共同构成了“测试语言”理论体系的技术基石,为智能测试方法论的发展开辟了新路径。
数据集最近研究
最新研究方向
在集成电路测试领域,ASAP7数据集正推动基于语言模型的自动化测试生成研究。前沿工作聚焦于利用大规模语言模型解析门级网表结构与测试激励间的隐含关联,通过真实RTL设计衍生的结构数据突破传统随机生成方法的局限性。该数据集与FreeSet开源项目的结合,为研究功能逻辑到物理实现的映射规律提供了工业级验证基础,相关成果已在IEEE国际测试会议中展示,标志着AI驱动测试向量生成从理论探索迈向实际应用阶段。
以上内容由遇见数据集搜集并总结生成



