SciSafetyBench
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/ulab-uiuc/SafeScientist
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个专门为评估科学背景下人工智能安全性而设计的全新基准,它包含了6个领域内的240个高风险科学任务,同时配备了30个特别设计的科学工具以及120个与工具相关的风险任务。该数据集包括为评估人工智能驱动科学研究安全性而量身定制的高风险任务和工具。任务的重点是评估科学研究中的AI安全性。



