henryen/origen_dataset_description
收藏Hugging Face2024-10-19 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/henryen/origen_dataset_description
下载链接
链接失效反馈官方服务:
资源简介:
OriGen数据集包括三个部分:origen_dataset_instruction、origen_dataset_debug和origen_dataset_description。origen_dataset_description数据集包含`Description`和`Code`格式的数据,其中`Description`是模块的描述,`Code`是生成的Verilog代码。origen_dataset_instruction数据集是通过将`Description`转换为`Instruction`得到的。origen_dataset_debug数据集用于训练OriGen_Fix模型,该模型用于修复Verilog代码中的语法错误。这些数据集用于训练和微调OriGen和OriGen_Fix模型,以生成和修复Verilog代码。
The OriGen dataset is a fine-tuned lora model for Verilog code generation, trained on top of DeepSeek Coder 7B using datasets generated from code-to-code augmentation and self-reflection. The dataset features include `Instruction` and `Response`, where `Instruction` is the description of the module and `Response` is the generated Verilog code.
提供机构:
henryen



