stanford-crfm/air-bench-2024

Name: stanford-crfm/air-bench-2024
Creator: stanford-crfm
Published: 2024-08-14 20:51:02
License: 暂无描述

Hugging Face2024-08-14 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/stanford-crfm/air-bench-2024

下载链接

链接失效反馈

官方服务：

资源简介：

AIRBench 2024是一个AI安全基准测试数据集，旨在与新兴的政府法规和公司政策保持一致。它包含多样化的恶意提示，覆盖了基于法规的安全类别。数据集分为多个配置，如default、china、eu_comprehensive、eu_mandatory、us和judge_prompts，每个配置包含不同的CSV文件。数据集的语言为英语，许可证为cc-by-4.0。

AIRBench 2024 is a AI safety benchmark that aligns with emerging government regulations and company policies. It consists of diverse, malicious prompts spanning categories of the regulation-based safety categories in the AIR 2024 safety taxonomy. The dataset is divided into multiple configurations such as default, china, eu_comprehensive, eu_mandatory, us, and judge_prompts, each containing different CSV files. The language of the dataset is English, and the license is cc-by-4.0.

提供机构：

stanford-crfm

原始信息汇总

AIRBench 2024 数据集概述

数据集详情

数据集描述

AIRBench 2024 是一个与新兴政府法规和公司政策对齐的 AI 安全基准。它包含多样化的恶意提示，涵盖 AIR 2024 安全分类法中的法规基础安全类别。

语言(NLP): 英语
许可证: cc-by-4.0

数据集结构

数据集包含多个配置，每个配置包含不同的数据文件：

default:
- 数据文件: category_1.csv 至 category_45.csv
china:
- 数据文件: category_4.csv 至 category_45.csv
eu_comprehensive:
- 数据文件: category_1.csv 至 category_45.csv
eu_mandatory:
- 数据文件: category_4.csv 至 category_4142.csv
us:
- 数据文件: category_1.csv 至 category_45.csv
judge_prompts:
- 数据文件: judge_prompt_final.csv

数据集子集

default 子集:
- cate-idx: AIR 类别的标识符
- l2-name: AIR 二级类别的名称
- l3-name: AIR 三级类别的名称
- l4-name: AIR 四级类别的名称
- prompt: 发送给待评估模型的提示
judge_prompts 子集:
- cate-idx: 与 default 子集相同
- l2-name: 与 default 子集相同
- l3-name: 与 default 子集相同
- l4-name: 与 default 子集相同
- judge_prompt: 法官模型的提示模板

数据集加载

在 Python 中加载待评估模型的提示数据集：

python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", split="test")

加载特定区域的 AIR 2024 类别对应的提示数据集：

python import datasets region = "us" # 设置为 ["china", "eu_comprehensive", "eu_mandatory", "us"] 之一 datasets.load_dataset("stanford-crfm/air-bench-2024", region, split="test")

加载法官模型的提示模板数据集：

python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", "judge_prompts", split="test")

搜集汇总

数据集介绍

背景与挑战

背景概述

AIRBench 2024是一个AI安全基准测试数据集，包含多样化的恶意提示，旨在评估AI模型在应对潜在安全威胁时的表现。数据集支持多种地区和特定类别的测试，适用于研究和开发安全的AI系统。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集