five

AVE

收藏
arXiv2025-09-30 收录
下载链接:
https://sites.google.com/view/audiovisualresearch
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为AVE,是AudioSet的一个子集,包含4143个长度为10秒的视频,涵盖28个不同的事件类别,如车辆声音、动物活动、乐器表演等。每个视频都提供了视频级别和片段级别的标签,并且具有清晰的时间边界。事件必须在听觉和视觉上都是可辨识的,并且至少持续两秒钟。该数据集包括原始测试集和修正测试集,分别称为O-AVE和C-AVE。整个数据集规模达到4143个视频,其任务是进行音频-视觉事件定位。
提供机构:
AudioSet
搜集汇总
背景与挑战
背景概述
AVE是AudioSet的子集,包含4143个10秒视频,涵盖28个事件类别,如车辆声音和乐器表演。数据集提供视频和片段级别标签,事件需在听觉和视觉上可辨识且持续至少2秒,包括O-AVE和C-AVE测试集,用于音频-视觉事件定位任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作