innodatalabs/rt2-beavertails-simple
收藏Hugging Face2024-11-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/innodatalabs/rt2-beavertails-simple
下载链接
链接失效反馈官方服务:
资源简介:
Beavertails数据集是一个用于红队测试的数据集,旨在评估问答助手的安全性。数据集包含对话消息、预期结果和唯一标识符。示例展示了系统、用户和助手之间的对话,以及如何判断回答是否安全。数据集的结构包括messages(包含角色和内容)、expected(预期结果)和id(唯一标识符)。数据集的使用示例代码展示了如何加载和遍历数据集。
Red teaming Beavertails dataset, used for evaluating the safety of Q&A assistants. The dataset includes conversation messages, expected outcomes, and unique ID identifiers. Each message contains a role and content, with the expected outcome indicating the safety of the answer. The dataset is not suitable for all audiences.
提供机构:
innodatalabs



