MediaSpeech

Name: MediaSpeech
Creator: OpenDataLab
Published: 2026-05-24 09:30:28
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/MediaSpeech

下载链接

链接失效反馈

官方服务：

资源简介：

MediaSpeech 是一个媒体语音数据集（您可能已经猜到了），旨在测试自动语音识别 (ASR) 系统的性能。该数据集由从 YouTube 上可用的媒体视频中自动提取并手动转录的简短语音片段组成，并进行了一些预处理和后处理。该数据集包含所提供的每种语言的 10 小时语音。此版本包含法语、阿拉伯语、土耳其语和西班牙语的音频数据集，是更大的私有数据集的一部分。

提供机构：

OpenDataLab

创建时间：

2022-08-19

搜集汇总

数据集介绍