five

VGGSound-Sparse

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VGGSound-Sparse
下载链接
链接失效反馈
官方服务:
资源简介:
与时空数据集密集 (例如,LRS3中裁剪的谈话面孔) 相反,我们对解决时空视频稀疏的同步感兴趣。由于其具有挑战性,尚未建立衡量进展的公共基准。为了弥合这一差距,我们策划了一个视频VGGSound的子集,这些视频具有在时间和空间上稀疏的视听对应关系。我们称之为VGGSound-稀疏。它由6.5k视频组成,跨越12个 “火花” 类,如狗吠,砍柴,滑板等。
提供机构:
OpenDataLab
创建时间:
2022-11-24
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VGGSound-Sparse是一个针对时空视频稀疏同步问题的公开基准数据集,基于VGGSound子集构建,包含6.5k个视频,覆盖狗吠、砍柴等12个'火花'类别。该数据集由牛津大学、上海交通大学和坦佩雷大学于2022年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作