RMCBench

arXiv2025-09-30 收录

下载链接：

https://huggingface.co/datasets/zhongqy/rmcbench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为RMCBench，是首个包含473个提示的基准测试，旨在评估大型语言模型（LLM）在抵抗恶意代码生成方面的能力。该测试利用了文本到代码以及代码到代码的场景。此外，该基准测试还包括了LLM根据文本描述生成代码以及翻译或完成现有恶意代码的场景，突显了不同模型在拒绝生成恶意代码方面的差异。该数据集的规模为473个提示，任务是对抗恶意代码生成能力的评估。

5,000+

优质数据集

54 个

任务类型

进入经典数据集