five

HowToVQA69M

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HowToVQA69M
下载链接
链接失效反馈
官方服务:
资源简介:
包含 69,270,581 个视频剪辑、问答三元组 (v, q, a) 的数据集。 HowToVQA69M 比任何当前可用的 VideoQA 数据集大两个数量级。平均而言,每个原始视频会产生 43 个视频剪辑,每个剪辑持续 12.1 秒,并与 1.2 个问答对相关联。问题和答案平均分别包含 8.7 和 2.4 个单词。 HowToVQA69M 高度多样化,包含超过 16M 的唯一答案,其中超过 2M 的唯一答案出现不止一次,超过 300K 的唯一答案出现十次以上。

This dataset contains 69,270,581 video clips and question-answer triples (v, q, a). HowToVQA69M is two orders of magnitude larger than any currently available VideoQA dataset. On average, each raw video yields 43 video clips, each lasting 12.1 seconds and associated with 1.2 question-answer pairs. The questions and answers contain an average of 8.7 and 2.4 words respectively. HowToVQA69M is highly diverse, encompassing over 16 million unique answers, among which more than 2 million unique answers appear more than once, and over 300,000 unique answers appear more than ten times.
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HowToVQA69M是一个大规模视频问答数据集,包含69,270,581个视频剪辑和对应的问答三元组,每个视频剪辑平均持续12.1秒,并与1.2个问答对相关联。该数据集以其高度多样性著称,拥有超过16M的唯一答案,覆盖视频CV、自然语言处理和视觉问答等多个领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作