VGGSound-Sparse

Name: VGGSound-Sparse
Creator: OpenDataLab
Published: 2026-05-17 07:30:36
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/VGGSound-Sparse

下载链接

链接失效反馈

官方服务：

资源简介：

与时空数据集密集 (例如，LRS3中裁剪的谈话面孔) 相反，我们对解决时空视频稀疏的同步感兴趣。由于其具有挑战性，尚未建立衡量进展的公共基准。为了弥合这一差距，我们策划了一个视频VGGSound的子集，这些视频具有在时间和空间上稀疏的视听对应关系。我们称之为VGGSound-稀疏。它由6.5k视频组成，跨越12个 “火花” 类，如狗吠，砍柴，滑板等。

提供机构：

OpenDataLab

创建时间：

2022-11-24

搜集汇总

数据集介绍