SabrinaSadiekh/not_hate_dataset
收藏Hugging Face2025-11-13 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/SabrinaSadiekh/not_hate_dataset
下载链接
链接失效反馈官方服务:
资源简介:
Not Dataset是一个包含基于否定的有害/安全句子对的数据集,设计用于在严格句法控制下评估大型语言模型中潜在信念的一致性。
The Not Dataset is a collection of negation-based harmful/safe sentence pairs designed for evaluating the consistency of latent beliefs in large language models under strict syntactic control.
提供机构:
SabrinaSadiekh



