collusion-signal-stress-test-generated
收藏Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/alignment-science/collusion-signal-stress-test-generated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含200个训练样本(总计2.6MB),主要记录与工具调用相关的安全事件数据。数据集包含6个结构化字段:任务ID(字符串)、任务描述(字符串)、诚实工具调用记录(字符串)、攻击工具调用记录(字符串)、攻击类型(字符串)、攻击成功评分(浮点数)和攻击隐蔽性评分(浮点数)。数据适用于分析安全攻击模式、评估工具调用风险等任务,特别适合用于检测恶意工具使用行为或构建攻击特征模型的研究。
创建时间:
2026-03-17



