collusion-signal-stress-test-rollouts
收藏Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/alignment-science/collusion-signal-stress-test-rollouts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含200个训练样本,主要记录任务执行与攻击行为相关数据。数据结构包含7个特征字段:任务ID(task_id)、任务描述(task_description)、正常工具调用记录(honest_tool_calls)、攻击工具调用记录(attack_tool_calls)、攻击类型(attack_type)、攻击成功率评分(attack_success_score)和攻击隐蔽性评分(attack_subtlety_score)。数据集总大小为5.7MB,下载压缩包约1.2MB。数据以训练集单一划分形式存储,适用于分析工具调用模式、攻击行为检测及安全评估等任务场景。
创建时间:
2026-03-17



