VGGSound-Sparse
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VGGSound-Sparse
下载链接
链接失效反馈官方服务:
资源简介:
与时空数据集密集 (例如,LRS3中裁剪的谈话面孔) 相反,我们对解决时空视频稀疏的同步感兴趣。由于其具有挑战性,尚未建立衡量进展的公共基准。为了弥合这一差距,我们策划了一个视频VGGSound的子集,这些视频具有在时间和空间上稀疏的视听对应关系。我们称之为VGGSound-稀疏。它由6.5k视频组成,跨越12个 “火花” 类,如狗吠,砍柴,滑板等。
提供机构:
OpenDataLab
创建时间:
2022-11-24
搜集汇总
数据集介绍

背景与挑战
背景概述
VGGSound-Sparse是一个针对时空视频稀疏同步问题的公开基准数据集,基于VGGSound子集构建,包含6.5k个视频,覆盖狗吠、砍柴等12个'火花'类别。该数据集由牛津大学、上海交通大学和坦佩雷大学于2022年发布。
以上内容由遇见数据集搜集并总结生成



