shalanova/benchmark-4-russian-gt

Name: shalanova/benchmark-4-russian-gt
Creator: shalanova
Published: 2026-04-30 04:31:06
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/shalanova/benchmark-4-russian-gt

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过Google Translate翻译成俄语的，来源于nvidia/Aegis-AI-Content-Safety-Dataset-2.0。数据集领域包括异质不安全类别（如有害指令、敏感话题、对抗性重述），并包含不一定遵循典型越狱模板的提示。这种增加的多样性和分布变异性使得基于相似性的检测更具挑战性，并为跨语言迁移提供了压力测试。数据集大小为1,000个提示（500个安全/500个不安全）。列包括：text（原始提示）、label（0：安全，1：不安全）、translation（通过Google Translate翻译成俄语的提示）和score_ru_google（与codebook的余弦相似度得分）。

The dataset is translated into Russian by Google Translate, sourced from nvidia/Aegis-AI-Content-Safety-Dataset-2.0. The domain includes heterogeneous unsafe categories (e.g., harmful instructions, sensitive topics, adversarial rephrasings) and contains prompts that do not necessarily follow canonical jailbreak templates. This increased diversity and distributional variability makes similarity-based detection more challenging and provides a stress-test for cross-lingual transfer. The dataset size is 1,000 prompts (500 safe / 500 unsafe). Columns include: text (original prompt), label (0: safe, 1: unsafe), translation (prompt translated into Russian by Google Translate), and score_ru_google (cosine similarity score with codebook).

提供机构：

shalanova

5,000+

优质数据集

54 个

任务类型

进入经典数据集