thrivikram3301/guardrail-safety-dataset
收藏Hugging Face2026-04-26 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/thrivikram3301/guardrail-safety-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Guardrail数据集是一个经过清洗和去重处理的数据集,专门用于训练大型语言模型(LLM)的安全护栏。该数据集整合了来自Aegis 2.0、Prompt Injection和HH-RLHF三个来源的数据,旨在提高LLM在安全方面的性能,例如防止有害内容生成或对抗提示注入攻击。数据集适用于文本分类任务,语言为英文,采用MIT许可证。
Cleaned and deduplicated dataset for training LLM safety guardrails. Combined from Aegis 2.0, Prompt Injection, and HH-RLHF.
提供机构:
thrivikram3301



