VeriReason-RTL-Coder_7b_reasoning_tb_simple

Hugging Face2025-05-20 更新2025-05-21 收录

下载链接：

https://huggingface.co/datasets/Nellyw888/VeriReason-RTL-Coder_7b_reasoning_tb_simple

下载链接

链接失效反馈

官方服务：

资源简介：

VeriReason-RTL-Coder_7b_reasoning_tb是一个高质量的用于训练和评估Verilog寄存器传输级（RTL）代码生成模型的数据集，具有显式推理能力。该数据集是在原始RTLCoder数据集的基础上构建和增强的，专门设计用于提高模型在RTL代码生成方面的推理能力和功能正确性。

创建时间：

2025-05-15

原始信息汇总

VeriReason Verilog Reasoning Dataset with Testbench - Simple 数据集概述

基本信息

任务类别: 文本生成 (text-generation)
语言: 英语 (en)
标签: Verilog, RTL, EDA, Hardware
数据集名称: VeriReason Verilog Reasoning Dataset with Testbench - Simple

项目描述

方法: 结合监督微调与GRPO强化学习，专门针对Verilog RTL代码生成
性能: 在VerilogEval Machine基准测试中达到83.1%功能正确率
模型优势:
- 相比基线方法首次尝试功能正确率提升2.8倍
- 对未见设计具有强泛化能力
- 基于Code Llama的7B参数模型

数据集摘要

用途: 训练和评估具有显式推理能力的Verilog RTL代码生成模型
基础数据: 基于RTLCoder数据集构建
增强内容:
- 使用GPT-4.1添加显式推理步骤
- 改进代码质量以更好遵循指令
- 包含GPT-4.1生成的测试平台
- 整合了测试平台运行结果

数据集结构

数据实例

每个实例包含:

id: 唯一标识符
instruction: RTL设计问题说明
output: 生成的Verilog代码解决方案
tb: 验证用测试平台代码
tb_result: 测试平台运行结果

数据字段

instruction: RTL设计问题说明(平均长度~3,973字符)
output: Verilog代码解决方案(平均长度~2,024字符)
tb: 测试平台代码(平均长度~1,551-12,700字符)
tb_result: 仿真结果(平均长度~5,800字符)

使用示例

python from datasets import load_dataset

dataset = load_dataset("Nellyw888/Verireason-RTL-Coder_7b_reasoning_tb_simple") example = dataset[train][0]

基于该数据集训练的模型

VeriReason-Qwen2.5-7b-RTLCoder-Verilog-GRPO-reasoning-tb
VeriReason-Qwen2.5-3b-RTLCoder-Verilog-GRPO-reasoning-tb
VeriReason-Qwen2.5-1.5b-RTLCoder-Verilog-GRPO-reasoning-tb
VeriReason-codeLlama-7b-RTLCoder-Verilog-GRPO-reasoning-tb

引用

bibtex @misc{wang2025verireason, title={VeriReason: Reinforcement Learning with Testbench Feedback for Reasoning-Enhanced Verilog Generation}, author={Yiting Wang and Guoheng Sun and Wanghao Ye and Gang Qu and Ang Li}, year={2025}, eprint={2505.11849}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2505.11849}, }

搜集汇总

数据集介绍

构建方式

在电子设计自动化领域，VeriReason-RTL-Coder_7b_reasoning_tb_simple数据集以RTLCoder数据集为基础，通过多维度增强构建而成。该数据集采用GPT-4.1生成显式推理步骤，优化代码质量以提升指令遵循能力，并创新性地集成了测试平台代码及仿真结果。每个数据实例均包含完整的验证闭环，从设计问题描述、Verilog代码解决方案到测试平台验证结果，形成严谨的硬件描述语言学习样本。

使用方法

使用者可通过Hugging Face数据集库直接加载该资源，标准接口返回包含指令、输出代码、测试平台和验证结果的结构化数据。典型应用场景包括监督式微调和强化学习训练，其中测试平台结果可作为自动评估指标。研究人员也可单独提取测试平台组件，用于验证其他模型生成的RTL代码功能正确性，实现跨模型性能比对。

背景与挑战

背景概述

VeriReason-RTL-Coder_7b_reasoning_tb_simple数据集由Yiting Wang等研究人员于2025年提出，旨在解决硬件描述语言（HDL）自动生成领域的核心问题。该数据集聚焦于Verilog RTL代码生成任务，结合强化学习与测试平台反馈机制，显著提升了模型在功能正确性方面的表现。研究团队基于RTLCoder数据集进行深度优化，通过引入GPT-4.1生成显式推理步骤和测试平台，构建了当前最先进的自动化RTL综合基准。该成果在VerilogEval Machine基准测试中达到83.1%的功能正确率，为电子设计自动化（EDA）领域提供了新的方法论突破。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，Verilog代码生成需要精确处理硬件时序逻辑与组合逻辑的复杂交互，同时满足严格的语法规范与功能等价性验证；在构建过程中，如何通过测试平台反馈建立有效的强化学习奖励机制，以及确保生成代码与测试平台的协同优化成为关键难点。数据增强阶段依赖GPT-4.1生成推理步骤可能引入潜在偏差，而测试平台仿真结果的完整性验证也需要特殊设计。这些挑战使得数据集的构建需要跨越多学科知识边界，整合自然语言处理、形式化验证与数字电路设计等多个领域的技术。

常用场景

经典使用场景

在电子设计自动化（EDA）领域，VeriReason-RTL-Coder_7b_reasoning_tb_simple数据集为Verilog RTL代码生成任务提供了高质量的基准。该数据集通过结合显式推理步骤和测试台验证，成为训练和评估代码生成模型的理想选择。研究人员利用该数据集优化模型在硬件描述语言生成中的功能正确性，特别是在复杂电路设计场景下，模型能够生成符合规范且可综合的Verilog代码。

解决学术问题

该数据集有效解决了硬件设计自动化中的关键学术问题，包括如何提高生成代码的功能正确性和可综合性问题。通过引入测试台反馈机制和强化学习优化，显著提升了模型在首次尝试时的正确率，最高可达83.1%。这一突破为自动化RTL综合设立了新的技术标杆，同时为小参数模型在专业领域超越大型通用模型提供了实证案例。

实际应用

在实际工程应用中，该数据集支撑的模型可大幅提升数字电路设计效率。工程师只需输入自然语言描述的设计需求，系统即可自动生成经过验证的Verilog代码，显著缩短从设计到实现的周期。这种能力特别适用于快速原型开发、IP核生成以及教育场景中的硬件设计教学，为半导体行业带来实质性的生产力提升。

数据集最近研究