ICCAD 2026 Problem A Open Benchmark
收藏ICCAD 2026 Problem A — 开源基准测试数据集
数据集概述
本数据集是为 ICCAD 2026 Contest Problem A: LLM-Assisted Netlist Exploration and Transformation 构建的社区基准测试集。该竞赛要求团队构建一个系统,能够接受自然语言请求,解释这些请求,并在门级Verilog设计上执行分析或转换流程。
核心目标
- 减少对单一团队评估集的过拟合:来自众多贡献者的对抗性测试用例覆盖了任何单一团队难以独立想到的边界案例。
- 精确匹配竞赛I/O格式:符合问题陈述第3节定义的格式,通过测试用例的系统可确保与真实评估器正确连接。
- 开放邀请:公开、MIT许可、无需NDA、无团队隶属限制。
数据集结构
ICCAD2026_Problem-A_Benchmark/ ├── README.md # 英文说明文件 ├── CONTRIBUTING.md # 添加新测试用例的规则 ├── LICENSE # MIT许可证 ├── docs/ │ ├── META_SCHEMA.md # 可选的每个用例meta.yaml模式 │ └── MANUAL_REVIEW_WORKFLOW.md # 如何编写黄金答案 ├── tests/ │ └── case_<name>/ │ ├── design.v # 门级Verilog设计(一个顶层模块,仅基本单元) │ ├── requests.txt # 每行一个自然语言请求,通过stdin输入 │ ├── golden.log # 参考输出,格式为#RESPONSE/#END │ ├── meta.yaml # 可选:每个提示的任务类型+预期结果种类 │ └── README.md # 设计描述+问题意图 ├── runner/ │ ├── run_bench.py # 推荐使用的Python运行器 │ └── run_bench.sh # 旧版Shell运行器 ├── tools/ │ ├── convert_official.py # 转换官方测试用例发布→基准模式 │ └── render_diff.py # 黄金输出与实际输出的并排Markdown差异 └── results/ # 每次运行生成的结果(被git忽略)
格式合规性
| 竞赛规范(问题陈述第3节) | 本数据集实现 |
|---|---|
| 系统从stdin读取NL请求,每行一个 | tests/<case>/requests.txt 就是这个流 |
系统向stdout写入响应,以#RESPONSE <id> / #END <id>分隔 |
tests/<case>/golden.log 是这个格式的参考响应流 |
系统还将副本写入<case_name>.log |
运行器将实际日志捕获到results/<run>/<case>/system.log |
测试用例以 This is the beginning of testcase <name>... 开始 |
requests.txt 的第一行遵循此模式 |
| 每个提示超时:基本操作60秒,其他300秒 | runner/run_bench.py 强制执行两者 |
运行器使用
快速开始
- 克隆仓库并进入
- 安装运行器依赖(仅PyYAML)
- 设置环境变量指向系统二进制文件
- 运行单个用例:
python3 runner/run_bench.py --source community --cases case_demo01 - 运行所有社区用例:
python3 runner/run_bench.py --source community
CLI参考
| 标志 | 默认值 | 描述 |
|---|---|---|
--system-cmd |
环境变量$BENCH_SYSTEM_CMD |
调用被测系统的Shell命令 |
--source |
all |
测试用例来源:community、official、personal、all |
--cases |
无 | 逗号分隔的用例名称过滤器 |
--output-dir |
results/run_<timestamp>/ |
结果输出目录覆盖 |
--list-only |
关闭 | 列出发现的用例目录而不运行 |
混合公共/私有测试集
- 公共测试集:
tests/case_<name>/,MIT许可,任何人都可贡献 - 私有官方测试集:
private/official_0510/test<NN>/,被git忽略,2026-05-10由Cadence发布的40个官方测试用例
贡献测试用例
详细格式要求见CONTRIBUTING.md,基本要求:
- 创建
tests/case_<your_name>/目录,包含design.v、requests.txt、golden.log和README.md - 可选添加
meta.yaml以使后续自动评分器能够评分 - 提交PR,CI将验证格式、Verilog可解析性和
#RESPONSE计数 - 维护者审核设计、问题和黄金答案
许可证
MIT许可证 — 可自由复制、修改和重新分发。
当前状态
- 2026-05-07:初始框架 + 6个来自竞赛问题陈述示例的样本测试用例
- 2026-05-14:Python运行器 + meta.yaml模式 +
case_c17(ISCAS85) +case_spec_gaps(规范第4.3节转换模式)




