five

shalanova/benchmark-3-chinese-m2m

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/shalanova/benchmark-3-chinese-m2m
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由JailbreakBench/JBB-Behaviors翻译而来,使用了facebook/m2m100_418M模型进行中文翻译。数据集包含异构的不安全类别(如有害指令、敏感话题、对抗性重述等),并且包含不一定遵循典型越狱模板的提示。这种多样性和分布变异性使得基于相似性的检测更具挑战性,并为跨语言迁移提供了压力测试。数据集大小为200个提示(100个安全/100个不安全),包含四个列:text(原始提示)、label(0表示安全,1表示不安全)、translation(中文翻译的提示)、score_zh_model(与codebook的余弦相似度得分)。

Translated from JailbreakBench/JBB-Behaviors using the facebook/m2m100_418M model. The dataset includes heterogeneous unsafe categories (e.g., harmful instructions, sensitive topics, adversarial rephrasings) and contains prompts that do not necessarily follow canonical jailbreak templates. This increased diversity and distributional variability makes similarity-based detection more challenging and provides a stress-test for cross-lingual transfer. The dataset size is 200 prompts (100 safe / 100 unsafe) with four columns: text (original prompt), label (0: safe, 1: unsafe), translation (prompt translated into Chinese), score_zh_model (cosine similarity score with codebook).
提供机构:
shalanova
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作