five

BELLS

收藏
arXiv2024-06-03 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2406.01364v1
下载链接
链接失效反馈
官方服务:
资源简介:
BELLS数据集是由瑞士洛桑联邦理工学院和法国巴黎人工智能安全中心等机构联合创建,旨在评估大型语言模型(LLM)的安全保障措施。该数据集包含1200条记录,涵盖了从简单到复杂的多种系统监督和故障类型检测,旨在通过三种测试类别(已建立的故障测试、新兴故障测试和下一代架构测试)来比较和提升输入输出保障措施的性能。数据集的创建过程涉及对现有基准的整合和新故障模式的探索,以及对未来应用的适应性测试。BELLS数据集的应用领域广泛,包括实时监控、离线跟踪评估和内容审核,旨在解决LLM系统中潜在的安全风险和故障模式。
提供机构:
瑞士洛桑联邦理工学院, 法国巴黎人工智能安全中心, 法国索邦大学, CNRS, LIP6
创建时间:
2024-06-03
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作