five

MediaSpeech

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MediaSpeech
下载链接
链接失效反馈
官方服务:
资源简介:
MediaSpeech 是一个媒体语音数据集(您可能已经猜到了),旨在测试自动语音识别 (ASR) 系统的性能。该数据集由从 YouTube 上可用的媒体视频中自动提取并手动转录的简短语音片段组成,并进行了一些预处理和后处理。该数据集包含所提供的每种语言的 10 小时语音。此版本包含法语、阿拉伯语、土耳其语和西班牙语的音频数据集,是更大的私有数据集的一部分。
提供机构:
OpenDataLab
创建时间:
2022-08-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作