ACAV100M (Automatically Curated Audio-Visual)
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ACAV100M
下载链接
链接失效反馈官方服务:
资源简介:
ACAV100M 处理 1.4 亿个全长视频(总时长 1,030 年),用于生成 1 亿个 10 秒剪辑(31 年)的数据集,具有高度的视听对应关系。这比目前视听学习文献中使用的最大视频数据集 AudioSet(8 个月)大两个数量级,是文献中最大的视频数据集 HowTo100M(15 年)的两倍.
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍

背景与挑战
背景概述
ACAV100M是一个自动策划的音频-视觉数据集,包含1亿个10秒视频剪辑,总时长31年,源自1.4亿个全长视频。该数据集在规模上远超AudioSet和HowTo100M,由英伟达研究院和Microsoft Research于2021年发布。
以上内容由遇见数据集搜集并总结生成



