five

Chuntianli/CrossVid

收藏
Hugging Face2025-11-13 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/Chuntianli/CrossVid
下载链接
链接失效反馈
官方服务:
资源简介:
CrossVid是一个大规模的多任务数据集,旨在推动视觉语言模型在跨视频理解能力上的发展。该数据集包含10种不同的任务类型,要求模型能够跨多个视频进行推理,理解时间动态、空间关系以及复杂的叙事结构。

CrossVid is a large-scale multi-task dataset designed to advance cross-video understanding capabilities in vision-language models. The dataset encompasses 10 diverse task types that require models to reason across multiple videos, understand temporal dynamics, spatial relationships, and complex narrative structures.
提供机构:
Chuntianli
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作