tulu-3-harmbench-eval
收藏魔搭社区2025-12-05 更新2025-05-31 收录
下载链接:
https://modelscope.cn/datasets/allenai/tulu-3-harmbench-eval
下载链接
链接失效反馈官方服务:
资源简介:
This data comes from the [HarmBench](https://arxiv.org/abs/2402.04249) benchmark.
This is one of the datasets included in the [Ai2 Safety Evaluation Suite](https://github.com/allenai/safety-eval), and the [Tülu 3](https://arxiv.org/abs/2411.15124v1) evaluation suite.
The repo for Ai2's safety suite includes instructions on how to evaluate models on various safety-related evaluation including this one.
本数据集源自HarmBench基准测试(HarmBench)。
本数据集是AI2安全评估套件(Ai2 Safety Evaluation Suite)与Tülu 3评估套件所收录的数据集之一。
AI2安全评估套件的代码仓库中包含了针对各类安全相关评估任务(含本数据集对应的评估任务)的模型评估指南。
提供机构:
maas
创建时间:
2025-05-27



