stanford-crfm/air-bench-2024
收藏Hugging Face2024-08-14 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/stanford-crfm/air-bench-2024
下载链接
链接失效反馈官方服务:
资源简介:
AIRBench 2024是一个AI安全基准测试数据集,旨在与新兴的政府法规和公司政策保持一致。它包含多样化的恶意提示,覆盖了基于法规的安全类别。数据集分为多个配置,如default、china、eu_comprehensive、eu_mandatory、us和judge_prompts,每个配置包含不同的CSV文件。数据集的语言为英语,许可证为cc-by-4.0。
AIRBench 2024 is a AI safety benchmark that aligns with emerging government regulations and company policies. It consists of diverse, malicious prompts spanning categories of the regulation-based safety categories in the AIR 2024 safety taxonomy. The dataset is divided into multiple configurations such as default, china, eu_comprehensive, eu_mandatory, us, and judge_prompts, each containing different CSV files. The language of the dataset is English, and the license is cc-by-4.0.
提供机构:
stanford-crfm
原始信息汇总
AIRBench 2024 数据集概述
数据集详情
数据集描述
AIRBench 2024 是一个与新兴政府法规和公司政策对齐的 AI 安全基准。它包含多样化的恶意提示,涵盖 AIR 2024 安全分类法中的法规基础安全类别。
- 语言(NLP): 英语
- 许可证: cc-by-4.0
数据集结构
数据集包含多个配置,每个配置包含不同的数据文件:
-
default:
- 数据文件: category_1.csv 至 category_45.csv
-
china:
- 数据文件: category_4.csv 至 category_45.csv
-
eu_comprehensive:
- 数据文件: category_1.csv 至 category_45.csv
-
eu_mandatory:
- 数据文件: category_4.csv 至 category_4142.csv
-
us:
- 数据文件: category_1.csv 至 category_45.csv
-
judge_prompts:
- 数据文件: judge_prompt_final.csv
数据集子集
-
default 子集:
cate-idx: AIR 类别的标识符l2-name: AIR 二级类别的名称l3-name: AIR 三级类别的名称l4-name: AIR 四级类别的名称prompt: 发送给待评估模型的提示
-
judge_prompts 子集:
cate-idx: 与 default 子集相同l2-name: 与 default 子集相同l3-name: 与 default 子集相同l4-name: 与 default 子集相同judge_prompt: 法官模型的提示模板
数据集加载
在 Python 中加载待评估模型的提示数据集:
python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", split="test")
加载特定区域的 AIR 2024 类别对应的提示数据集:
python import datasets region = "us" # 设置为 ["china", "eu_comprehensive", "eu_mandatory", "us"] 之一 datasets.load_dataset("stanford-crfm/air-bench-2024", region, split="test")
加载法官模型的提示模板数据集:
python import datasets datasets.load_dataset("stanford-crfm/air-bench-2024", "judge_prompts", split="test")
搜集汇总
数据集介绍

背景与挑战
背景概述
AIRBench 2024是一个AI安全基准测试数据集,包含多样化的恶意提示,旨在评估AI模型在应对潜在安全威胁时的表现。数据集支持多种地区和特定类别的测试,适用于研究和开发安全的AI系统。
以上内容由遇见数据集搜集并总结生成



