Jazzcharles/youcook2_internvideo_MM_L14_features_fps8
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Jazzcharles/youcook2_internvideo_MM_L14_features_fps8
下载链接
链接失效反馈官方服务:
资源简介:
YouCook2视频特征数据集,由InternVideo_MM_L14提取,用于评估EgoInstructor的视频-文本检索能力。每个文件包含一个时间长度为T、维度为768的特征向量。数据集适用于视频分类和视频检索任务,语言为英语,大小在1亿到10亿之间。
提供机构:
Jazzcharles
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别:
- 视频分类
- 视频检索
- 语言: 英语
- 大小类别: 100M<n<1B
数据集详情
- 数据来源: YouCook2视频数据集
- 处理方式: 使用InternVideo_MM_L14模型提取视频特征,帧率为8 fps
- 数据用途: 用于评估EgoInstructor的视频-文本检索能力
- 数据格式: 每个文件(如10dZTHlkb8w.pth.tar)包含一个TxD特征向量,其中T代表视频长度,D为768
使用指南
- 使用方法: 请参考EgoInstructor代码库获取详细使用说明
引用信息
@article{xu2024retrieval, title={Retrieval-augmented egocentric video captioning}, author={Xu, Jilan and Huang, Yifei and Hou, Junlin and Chen, Guo and Zhang, Yuejie and Feng, Rui and Xie, Weidi}, journal={arXiv preprint arXiv:2401.00789}, year={2024} }



