longvideo_eval_videos
收藏LongVideo-Reason-eval 数据集概述
数据集简介
- 名称: LongVideo-Reason-eval
- 用途: 用于评估长视频推理能力的基准测试集(仅限研究用途)
- 关联项目: Long-RL(将强化学习扩展到长序列的研究项目)
数据构成
- 样本数量: 1,000个长视频样本
- 评估维度:
- 时间维度(Temporal)
- 目标与目的(Goal and Purpose)
- 空间维度(Spatial)
- 情节与叙事(Plot and Narrative)
- 数据来源: 从Shot2Story项目中精选的18K长视频中人工筛选构建
相关数据集
- 训练集: LongVideo-Reason(52K样本)
- 数据链接: https://huggingface.co/datasets/LongVideo-Reason/longvideo-reason
- 评估集: LongVideo-Reason-eval(当前数据集)
- 数据链接: https://huggingface.co/datasets/LongVideo-Reason/longvideo_eval_videos
使用方法
- 数据下载: 下载评估视频并解压至
longvila_videos目录 - 评估脚本: 使用提供的
eval.py脚本进行模型评估 bash python eval.py --model-path $MODEL_PATH --data-path LongVideo-Reason/longvideo-reason@test --video-dir $VIDEO_DIR --output-dir runs_${$MODEL_PATH}
相关研究
- 基础模型: 使用NVILA-8B视觉语言模型和开源推理LLM构建
- 训练方法: 两阶段训练(高质量推理标注+强化学习)
- 成果模型: LongVILA-R1(具有优秀视频推理能力的模型)
引用信息
bibtex @misc{long-rl, title = {Long-RL: Scaling RL to Long Sequences}, author = {Yukang Chen, Wei Huang, Shuai Yang, Qinghao Hu, Baifeng Shi, Hanrong Ye, Ligeng Zhu, Zhijian Liu, Pavlo Molchanov, Jan Kautz, Xiaojuan Qi, Sifei Liu,Hongxu Yin, Yao Lu, Song Han}, year = {2025}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/NVlabs/Long-RL}}, }
bibtex @article{chen2025longvila-r1, title={Scaling RL to Long Videos}, author={Yukang Chen and Wei Huang and Baifeng Shi and Qinghao Hu and Hanrong Ye and Ligeng Zhu and Zhijian Liu and Pavlo Molchanov and Jan Kautz and Xiaojuan Qi and Sifei Liu and Hongxu Yin and Yao Lu and Song Han}, year={2025}, eprint={2507.07966}, archivePrefix={arXiv}, primaryClass={cs.CV} }
注意事项
- 许可: 代码使用Apache 2.0许可证
- 限制: 仅限研究用途




