five

allenai/Molmo2-Cap

收藏
Hugging Face2025-12-16 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/allenai/Molmo2-Cap
下载链接
链接失效反馈
官方服务:
资源简介:
Molmo2-Cap是一个包含非常长(平均900字)且详细的视频字幕的数据集。它可用于预训练和微调视觉语言模型。该数据集是Molmo2数据集集合的一部分,并用于训练Molmo2系列模型。数据集包含视频ID、剪辑时间戳、剪辑转录、剪辑字幕、帧时间戳、帧索引、帧字幕、视频转录、视频字幕、合并字幕等多种特征。建议使用合并字幕或视频帧合并字幕。注释质量评分(0-10)用于评估字幕的质量。

Molmo2-Cap is a dataset of very long (average 900 words), detailed video captions. It can be used to pre-train and fine-tune vision-language models. Molmo2-Cap is part of the Molmo2 dataset collection and was used to train the Molmo2 family of models. The dataset includes features such as video ID, clip timestamps, clip transcripts, clip captions, frame timestamps, frame indices, frame captions, video transcript, video caption, merged caption, etc. It is suggested to use either merged caption or video frame merged caption. The annotation score (0-10) is used to evaluate the quality of the captions.
提供机构:
allenai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作