walledai/SimpleSafetyTests
收藏Hugging Face2024-10-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/walledai/SimpleSafetyTests
下载链接
链接失效反馈官方服务:
资源简介:
SimpleSafetyTests(SST)是一个用于快速系统性地识别大型语言模型中关键安全风险的测试套件。它包含100个测试提示,这些提示涵盖了五个危害领域,大型语言模型在大多数应用中应该拒绝遵守这些提示。数据集分为info和instruct两个部分,每个部分包含50个示例。
SimpleSafetyTests (SST) is a test suite for rapidly and systematically identifying critical safety risks in large language models. It consists of 100 test prompts across five harm areas that large language models should refuse to comply with in the vast majority of applications. The dataset is split into two parts, info and instruct, each containing 50 examples.
提供机构:
walledai
原始信息汇总
数据集概述
数据特征
- prompt: 数据类型为字符串。
- harm_type: 数据类型为字符串。
数据分割
- info: 包含50个样本,占用4596.5字节。
- instruct: 包含50个样本,占用4596.5字节。
数据大小
- 下载大小: 7882字节。
- 数据集大小: 9193.0字节。
配置信息
- 默认配置:
- info: 数据文件路径为
data/info-*。 - instruct: 数据文件路径为
data/instruct-*。
- info: 数据文件路径为



