walledai/HarmBench
收藏Hugging Face2024-07-31 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/walledai/HarmBench
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个不同的配置:contextual、copyright和standard。每个配置都有特定的特征和分割。contextual配置包含prompt、context和category字段;copyright配置包含prompt和tags字段;standard配置包含prompt和category字段。每个配置的训练集大小和样本数量也有所不同。
The dataset includes three different configurations: contextual, copyright, and standard. Each configuration has specific features and splits. The contextual configuration includes prompt, context, and category fields; the copyright configuration includes prompt and tags fields; the standard configuration includes prompt and category fields. The size and number of examples in the training set vary for each configuration.
提供机构:
walledai
原始信息汇总
数据集概述
数据集配置
配置名称:contextual
- 特征:
prompt:字符串类型context:字符串类型category:字符串类型
- 分割:
train:- 字节数:45538.0
- 样本数:100
- 下载大小:90186
- 数据集大小:45538.0
- 数据文件路径:
train:contextual/train-*
配置名称:copyright
- 特征:
prompt:字符串类型tags:字符串类型
- 分割:
train:- 字节数:10260.0
- 样本数:100
- 下载大小:4952
- 数据集大小:10260.0
- 数据文件路径:
train:copyright/train-*
配置名称:standard
- 特征:
prompt:字符串类型category:字符串类型
- 分割:
train:- 字节数:22431.5
- 样本数:200
- 下载大小:12347
- 数据集大小:22431.5
- 数据文件路径:
train:standard/train-*
搜集汇总
数据集介绍

背景与挑战
背景概述
HarmBench是一个标准化评估框架数据集,专注于自动化红队测试和鲁棒性拒绝评估,包含英文行为提示,格式为parquet,遵循MIT许可证。该数据集与同名论文相关联,并已被多个模型用于训练或微调。
以上内容由遇见数据集搜集并总结生成



