VGG-SS 声源定位数据集
收藏超神经2022-10-26 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/20149
下载链接
链接失效反馈官方服务:
资源简介:
VGG-SS 全称 VGG Sound Source,是关于评估声源定位的视频数据集。该数据集包含 200 多个类别、 5000 个视频以及 VGG-Sound 数据集的新标注,比现有数据集大 10 倍。每个视频片段中的可见声源都被边界框明确标注。与 Flickr SoundNet 不同,该数据集的声源定位是基于视频的。
VGG-SS, whose full name is VGG Sound Source, is a video dataset for sound source localization evaluation. This dataset includes over 200 categories, 5000 video clips, and new annotations for the VGG-Sound dataset, and is 10 times larger than existing datasets. Each visible sound source in every video clip is clearly annotated with bounding boxes. Unlike Flickr SoundNet, the sound source localization of this dataset is video-based.
创建时间:
2022-10-26
搜集汇总
数据集介绍

背景与挑战
背景概述
VGG-SS声源定位数据集是一个包含200多个类别、5000个视频的大规模视频数据集,用于评估声源定位。每个视频片段中的可见声源都通过边界框明确标注,且该数据集比现有数据集大10倍,基于视频进行声源定位。
以上内容由遇见数据集搜集并总结生成



