MediaSpeech
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MediaSpeech
下载链接
链接失效反馈官方服务:
资源简介:
MediaSpeech 是一个媒体语音数据集(您可能已经猜到了),旨在测试自动语音识别 (ASR) 系统的性能。该数据集由从 YouTube 上可用的媒体视频中自动提取并手动转录的简短语音片段组成,并进行了一些预处理和后处理。该数据集包含所提供的每种语言的 10 小时语音。此版本包含法语、阿拉伯语、土耳其语和西班牙语的音频数据集,是更大的私有数据集的一部分。
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
MediaSpeech是一个用于评估自动语音识别(ASR)系统性能的多语言媒体语音数据集,包含法语、阿拉伯语、土耳其语和西班牙语各10小时的音频。这些数据源自YouTube视频的自动提取和手动转录片段,是更大私有数据集的一个公开子集。
以上内容由遇见数据集搜集并总结生成



