walledai/HarmBench

Name: walledai/HarmBench
Creator: walledai
Published: 2024-07-31 21:46:08
License: 暂无描述

Hugging Face2024-07-31 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/walledai/HarmBench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个不同的配置：contextual、copyright和standard。每个配置都有特定的特征和分割。contextual配置包含prompt、context和category字段；copyright配置包含prompt和tags字段；standard配置包含prompt和category字段。每个配置的训练集大小和样本数量也有所不同。

The dataset includes three different configurations: contextual, copyright, and standard. Each configuration has specific features and splits. The contextual configuration includes prompt, context, and category fields; the copyright configuration includes prompt and tags fields; the standard configuration includes prompt and category fields. The size and number of examples in the training set vary for each configuration.

提供机构：

walledai

原始信息汇总

数据集概述

数据集配置

配置名称：contextual

特征：
- prompt：字符串类型
- context：字符串类型
- category：字符串类型
分割：
- train：
  - 字节数：45538.0
  - 样本数：100
下载大小：90186
数据集大小：45538.0
数据文件路径：
- train：contextual/train-*

配置名称：copyright

特征：
- prompt：字符串类型
- tags：字符串类型
分割：
- train：
  - 字节数：10260.0
  - 样本数：100
下载大小：4952
数据集大小：10260.0
数据文件路径：
- train：copyright/train-*

配置名称：standard

特征：
- prompt：字符串类型
- category：字符串类型
分割：
- train：
  - 字节数：22431.5
  - 样本数：200
下载大小：12347
数据集大小：22431.5
数据文件路径：
- train：standard/train-*

搜集汇总

数据集介绍

背景与挑战

背景概述

HarmBench是一个标准化评估框架数据集，专注于自动化红队测试和鲁棒性拒绝评估，包含英文行为提示，格式为parquet，遵循MIT许可证。该数据集与同名论文相关联，并已被多个模型用于训练或微调。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集