AVSpeech

Name: AVSpeech
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/AVSpeech

下载链接

链接失效反馈

官方服务：

资源简介：

AVSpeech 是一个包含没有干扰背景信号的语音剪辑的大规模视听数据集。这些片段的长度不同，在 3 到 10 秒之间，并且在每个剪辑中，视频中唯一可见的面孔和配乐中的可听声音属于一个说话的人。该数据集总共包含大约 4700 小时的视频片段，大约有 150,000 个不同的说话者，涵盖了各种各样的人、语言和面部姿势。

提供机构：

OpenDataLab

创建时间：

2022-08-16

5,000+

优质数据集

54 个

任务类型

进入经典数据集