MediaSpeech
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MediaSpeech
下载链接
链接失效反馈官方服务:
资源简介:
MediaSpeech 是一个媒体语音数据集(您可能已经猜到了),旨在测试自动语音识别 (ASR) 系统的性能。该数据集由从 YouTube 上可用的媒体视频中自动提取并手动转录的简短语音片段组成,并进行了一些预处理和后处理。该数据集包含所提供的每种语言的 10 小时语音。此版本包含法语、阿拉伯语、土耳其语和西班牙语的音频数据集,是更大的私有数据集的一部分。
提供机构:
OpenDataLab
创建时间:
2022-08-19



