VideoEval
收藏VideoEval 数据集概述
数据集介绍
VideoEval 是一个全面的视频基础模型低成本评估基准套件。该数据集包括 VidTAB 和 VidEB 两个部分。
更新记录
- 2024/06/12: 发布了 VideoEval 的标注和评估代码。
安装与配置
VidTAB
基于 MMAction2 进行训练和评估: cmd pip install -U openmim mim install mmengine mmcv>=2.0.0rc1 mim install "mmdet>=3.0.0rc5" mim install "mmpose>=1.0.0rc0" git clone https://github.com/leexinhao/VideoEval.git cd VidTAB pip install -v -e .
基准测试
数据准备
由于潜在的版权问题,请参考 DATA.md 下载每个数据集的原始视频。VidTAB 可以直接使用我们准备的 标注文件。
视频任务适应性基准 (VidTAB)
少样本评估
训练和评估可以参考 MMAction2 文档,并提供了不同视频基础模型 (VFMs) 的 配置文件。
训练命令: bash python tools/train.py ${CONFIG_FILE} [ARGS]
提供了训练脚本 tools/my_train.sh 以简化参数设置:
bash
bash tools/my_train.sh configs/video_eval/AR_in_Dark/Internvideo2/frozen_tuning/InternVideo2-1B-stage1-pt_16_shot_bs16.py
零样本评估
零样本评估的提示词可以参考 图像骨干提示词 和 视频骨干提示词。
评估命令: bash bash exp/vid_zs.sh # 视频语言模型 bash exp/img_zs.sh # 图像语言模型
视频嵌入基准 (VidEB)
提供了评估的 示例,展示了嵌入提取和评估的流程。
引用
如果该数据集对你的研究有帮助,请考虑引用: BibTeX @article{li2024videoeval, title={VideoEval: Comprehensive Benchmark Suite for Low-Cost Evaluation of Video Foundation Model}, author={Li, Xinhao and Huang, Zhenpeng and Wang, Jing and Li, Kunchang and Wang, Limin}, journal={arXiv preprint arXiv:2407.06491}, year={2024} }

- 1VideoEval: Comprehensive Benchmark Suite for Low-Cost Evaluation of Video Foundation Model南京大学 上海人工智能实验室 · 2024年



