V1-33K
收藏arXiv2025-05-28 更新2025-11-28 收录
下载链接:
https://hf-mirror.com/datasets/haonan3/V1-33K
下载链接
链接失效反馈官方服务:
资源简介:
V1-33K是一个包含33,000个自动提取的视频片段的数据集,涵盖了各种现实场景。该数据集支持了下一个事件预测(NEP)任务,该任务旨在促进多模态大型语言模型(MLLMs)在视频输入上的时间推理能力。每个实例包括一个观察到的视频片段及其后续的总结,作为地面真实目标。V1-33K覆盖了广泛的内容领域和时间复杂性,从简单的短片段到复杂的、多步骤的场景。
提供机构:
新加坡国立大学海洋人工智能实验室
创建时间:
2025-05-28



