LLM Hardware Security Benchmarking Dataset

github2024-05-23 更新2024-05-31 收录

下载链接：

https://github.com/raha96/llmhws

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在托管包含潜在硬件漏洞的数据，这些数据足以支持大型语言模型的基准测试。数据集内容包括漏洞的英文描述、CWE分类、SystemVerilog断言以及原始源代码或其链接，以及许可信息。

This dataset is designed to host data containing potential hardware vulnerabilities, sufficient to support benchmarking for large language models. The dataset includes English descriptions of vulnerabilities, CWE classifications, SystemVerilog assertions, original source code or links to it, as well as licensing information.

创建时间：

2024-02-03

原始信息汇总

LLM Hardware Security Benchmarking Dataset 概述

数据集描述

目的: 本数据集旨在收集潜在的硬件漏洞信息，以支持大型语言模型的基准测试。
数据格式: 数据以YAML格式维护，便于版本控制和机器解析。
资源引用: 数据集资源包括但不限于Trust Hub, CAD4Assurance, CWE。
数据内容: 每条记录包含漏洞的英文描述、CWE分类、SystemVerilog断言、源代码链接及许可证信息。
数据开放性: 优先使用开源数据，非开源的高质量数据将根据情况决定处理方式。

数据结构

ID: 整数，自动递增，用于唯一标识记录。
Plain: 英文描述漏洞，可多行。
Threat: 威胁模型，如软件可通过硬件漏洞进行攻击。
WeaknessClassification: 弱点分类，如"CWE-###"。
CAPEC: CAPEC编号（如有）。
Assertions: SystemVerilog断言，用于检查漏洞。
Design: 设计文件路径或名称。
Origin: 数据集来源或源网站。
Reference: 参考URL。

漏洞严重性分类

策略级: 需要根本性改变设计规范。
决策级: 可通过团队内部决策调整解决。
打字级: 由单个开发者错误引起，可由开发者自行修正。

贡献指南

数据存储: 所有数据存储于source.yaml。
贡献规则: 遵循ContributionRules.md中的指南，尽量包含原始设计代码。
许可证注意: 使用或引用此仓库时，特别是包含外部代码的Designs文件夹，需注意相关许可证。

搜集汇总

数据集介绍

构建方式

该数据集的构建基于YAML格式，旨在通过人可读且机器可解析的方式，系统地记录硬件漏洞信息。数据来源包括但不限于Trust Hub、CAD4Assurance和CWE等资源。每条记录详细描述了漏洞的英文说明、CWE分类、SystemVerilog断言以及相关源代码或链接，并附有许可信息。开放源数据被优先考虑，以简化共享和贡献流程。若遇到高质量的非开放数据，将根据具体情况决定处理方式。

使用方法

用户可通过执行`python tools/dbgui.py source.yaml`命令启动GUI界面，进行数据集的浏览和记录添加。数据集的源数据存储在`source.yaml`文件中，其他格式如JSON和SQLDB将通过GitHub Actions自动生成。使用时需遵循`ContributionRules.md`中的指南，确保数据的一致性和准确性。此外，使用者应注意相关许可证，特别是涉及外部代码的`Designs`文件夹。

背景与挑战

背景概述

LLM Hardware Security Benchmarking Dataset（LLM硬件安全基准测试数据集）是一个旨在收集和分析硬件漏洞信息的预发布数据集。该数据集由未知的主要研究人员或机构创建，其核心研究问题在于通过提供足够的信息来支持大规模语言模型的基准测试。数据集的构建采用了YAML格式，确保了数据的可读性和可解析性，并便于通过Git进行版本控制。该数据集的资源来源包括Trust Hub、CAD4Assurance和CWE等，旨在涵盖硬件安全领域的多种漏洞类型。通过提供详细的漏洞描述、CWE分类、SystemVerilog断言以及原始源代码或其链接，该数据集为硬件安全研究提供了宝贵的资源。

当前挑战

LLM Hardware Security Benchmarking Dataset面临的主要挑战包括数据集的标准化和完整性问题。首先，数据集的架构和共享模式尚未完全确定，这可能导致数据共享和使用的不一致性。其次，数据集中可能存在缺失数据点，如何填补这些空白并确保数据质量是一个重要问题。此外，数据集的许可和归属问题也需要明确，以确保所有贡献者遵循一致的规则。技术层面的挑战则包括自动化生成其他格式的数据（如JSON和SQLDB），以提高数据集的可用性和兼容性。

常用场景

经典使用场景

在硬件安全领域，LLM Hardware Security Benchmarking Dataset 被广泛用于评估和基准测试大型语言模型对硬件漏洞的识别能力。该数据集通过提供详细的硬件漏洞描述、CWE分类、SystemVerilog断言以及原始源代码，为研究人员和工程师提供了一个全面的工具，以测试和改进模型在硬件安全方面的性能。通过这种方式，该数据集不仅促进了硬件安全研究的发展，还为实际应用中的漏洞检测提供了理论支持。

解决学术问题

LLM Hardware Security Benchmarking Dataset 解决了硬件安全领域中一个关键的学术问题，即如何有效评估和提升大型语言模型在识别硬件漏洞方面的能力。通过提供详尽的漏洞信息和分类，该数据集为研究人员提供了一个标准化的基准，使得不同模型之间的性能比较成为可能。这不仅推动了硬件安全技术的进步，还为未来的研究提供了坚实的基础。

实际应用

在实际应用中，LLM Hardware Security Benchmarking Dataset 被用于开发和测试硬件安全解决方案。例如，集成电路设计公司可以利用该数据集来验证其设计中的安全机制，确保在生产前识别并修复潜在的硬件漏洞。此外，该数据集还可用于培训硬件安全专家，提高他们在实际工作中识别和应对硬件漏洞的能力。

数据集最近研究