Video-SafetyBench
收藏Video-SafetyBench 数据集概述
基本信息
- 数据集名称: Video-SafetyBench
- 发布机构: BAAI
- 发布日期: 2025-05-14
- 数据集主页: https://liuxuannan.github.io/Video-SafetyBench.github.io/
- 论文地址: https://arxiv.org/abs/2505.11842
- 数据地址: https://huggingface.co/datasets/BAAI/Video-SafetyBench
数据集简介
Video-SafetyBench 是一个用于评估视频大型视觉语言模型(LVLMs)安全性的基准测试数据集。该数据集旨在解决现有多模态安全评估主要关注静态图像输入而忽略视频动态特性的问题。
数据集特点
- 数据规模: 包含 2,264 个视频-文本对
- 覆盖范围:
- 13 个不安全类别
- 48 个细粒度子类别
- 数据特征:
- 每个视频-文本对包含一个合成视频
- 每个视频配对一个有害查询和一个良性查询
技术贡献
- 可控合成管道:
- 将视频语义分解为主题图像和运动文本
- 共同指导合成与查询相关的视频
- 评估指标:
- 提出 RiskJudgeScore (RJScore)
- 基于 LLM 的度量标准
- 利用 token-level logit 分布
- 与人类安全判断高度一致
数据集结构示例
json { "question_id": "Unique ID for the question", "question": "The question", "harmful_intention": "The harmful intention for the question", "video_path": "video_path to the question", "category": "category to the question", "subcategory": "subcategory to the question" }
评估方法
响应生成
支持三种模型推理方式:
- Transformer-based 评估
- vllm-based 评估
- API-based 评估
响应评估
使用专用评估脚本对生成响应进行安全评估: bash python eval/evaluate.py --response_dir ./model_results --model_name LLaVA-Video-72B-Qwen2 --query_type harmful
引用信息
bibtex @article{liu2025videosafetybench, title={Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs}, author={Liu, Xuannan and Li, Zekun and He, Zheqi and Li, Peipei and Xia, Shuhan and Cui, Xing and Huang, Huaibo and Yang, Xi and He, Ran}, journal={arXiv preprint arXiv:2505.11842}, year={2025} }




