five

stanford-crfm/air-bench-2024

收藏
Hugging Face2024-08-14 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/stanford-crfm/air-bench-2024
下载链接
链接失效反馈
官方服务:
资源简介:
AIRBench 2024是一个AI安全基准测试数据集,旨在与新兴的政府法规和公司政策保持一致。它包含多样化的恶意提示,覆盖了基于法规的安全类别。数据集分为多个配置,如default、china、eu_comprehensive、eu_mandatory、us和judge_prompts,每个配置包含不同的CSV文件。数据集的语言为英语,许可证为cc-by-4.0。

AIRBench 2024 is a AI safety benchmark that aligns with emerging government regulations and company policies. It consists of diverse, malicious prompts spanning categories of the regulation-based safety categories in the AIR 2024 safety taxonomy. The dataset is divided into multiple configurations such as default, china, eu_comprehensive, eu_mandatory, us, and judge_prompts, each containing different CSV files. The language of the dataset is English, and the license is cc-by-4.0.
提供机构:
stanford-crfm
原始信息汇总

AIRBench 2024 数据集概述

数据集详情

数据集描述

AIRBench 2024 是一个与新兴政府法规和公司政策对齐的 AI 安全基准。它包含多样化的恶意提示,涵盖 AIR 2024 安全分类法中的法规基础安全类别。

  • 语言(NLP): 英语
  • 许可证: cc-by-4.0

数据集结构

数据集包含多个配置,每个配置包含不同的数据文件:

  • default:

    • 数据文件: category_1.csv 至 category_45.csv
  • china:

    • 数据文件: category_4.csv 至 category_45.csv
  • eu_comprehensive:

    • 数据文件: category_1.csv 至 category_45.csv
  • eu_mandatory:

    • 数据文件: category_4.csv 至 category_4142.csv
  • us:

    • 数据文件: category_1.csv 至 category_45.csv
  • judge_prompts:

    • 数据文件: judge_prompt_final.csv

数据集子集

  • default 子集:

    • cate-idx: AIR 类别的标识符
    • l2-name: AIR 二级类别的名称
    • l3-name: AIR 三级类别的名称
    • l4-name: AIR 四级类别的名称
    • prompt: 发送给待评估模型的提示
  • judge_prompts 子集:

    • cate-idx: 与 default 子集相同
    • l2-name: 与 default 子集相同
    • l3-name: 与 default 子集相同
    • l4-name: 与 default 子集相同
    • judge_prompt: 法官模型的提示模板

数据集加载

在 Python 中加载待评估模型的提示数据集:

python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", split="test")

加载特定区域的 AIR 2024 类别对应的提示数据集:

python import datasets region = "us" # 设置为 ["china", "eu_comprehensive", "eu_mandatory", "us"] 之一 datasets.load_dataset("stanford-crfm/air-bench-2024", region, split="test")

加载法官模型的提示模板数据集:

python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", "judge_prompts", split="test")

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AIRBench 2024是一个AI安全基准测试数据集,包含多样化的恶意提示,旨在评估AI模型在应对潜在安全威胁时的表现。数据集支持多种地区和特定类别的测试,适用于研究和开发安全的AI系统。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作