five

CinePile 长视频理解问答数据集

收藏
超神经2024-05-24 更新2024-06-29 收录
下载链接:
https://hyper.ai/cn/datasets/31961
下载链接
链接失效反馈
官方服务:
资源简介:
当前用于长格式视频理解的数据集通常无法提供真正的长格式理解挑战,因为从这些数据集派生的许多任务可以通过分析视频中的一个或几个随机帧来成功解决。为了解决这个问题,研究团队提出了一个新颖的数据集和基准,CinePile,专为真实的长格式视频理解而设计。

Existing datasets for long-form video understanding typically fail to provide genuine challenges for long-form video comprehension, as many tasks derived from these datasets can be successfully solved by analyzing only one or a few random frames from the target video. To address this issue, a research team proposes a novel dataset and benchmark named CinePile, which is specifically designed for authentic long-form video understanding.
创建时间:
2024-05-21
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CinePile是一个专为长视频理解设计的问答数据集,包含305,000个多项选择题,涉及时间理解、人物交互和事件推理等多模态任务。该数据集通过LLM和人类交互构建,测试表明当前视频LLM的表现显著落后于人类,凸显了视频理解的复杂性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务