ymoslem/MediaSpeech
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ymoslem/MediaSpeech
下载链接
链接失效反馈官方服务:
资源简介:
MediaSpeech是一个包含阿拉伯语、法语、西班牙语和土耳其语媒体语音的数据集,旨在测试自动语音识别(ASR)系统的性能。每个语言的数据集包含10小时的语音,这些语音片段是从YouTube上的媒体视频中自动提取并手动转录的。数据集的结构包括音频和句子两个特征。
MediaSpeech是一个包含阿拉伯语、法语、西班牙语和土耳其语媒体语音的数据集,旨在测试自动语音识别(ASR)系统的性能。每个语言的数据集包含10小时的语音,这些语音片段是从YouTube上的媒体视频中自动提取并手动转录的。数据集的结构包括音频和句子两个特征。
提供机构:
ymoslem
原始信息汇总
MediaSpeech 数据集概述
数据集描述
MediaSpeech 是一个包含阿拉伯语、法语、西班牙语和土耳其语媒体演讲的数据集,旨在测试自动语音识别(ASR)系统的性能。
数据集特征
- 音频(audio):
- 数据类型:音频
- 采样率:16000 Hz
- 句子(sentence):
- 数据类型:字符串
数据集分割
- 训练集(train):
- 样本数量:10023
语言支持
- 阿拉伯语(ar)
- 法语(fr)
- 西班牙语(es)
- 土耳其语(tr)
许可证
- 许可证类型:CC-BY-4.0
数据集大小
- 大小范围:1K<n<10K
标签
- 语音
任务类别
- 自动语音识别
- 文本到语音
数据集结构
- 包含两个主要特征:音频和句子
- 训练集包含2505个样本



