tommy19970714/common_voice
收藏Hugging Face2021-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tommy19970714/common_voice
下载链接
链接失效反馈官方服务:
资源简介:
Common Voice数据集由独特的MP3文件和相应的文本文件组成。数据集中的9,283个录音小时数中,许多还包括年龄、性别和口音等人口统计元数据,这些数据有助于训练语音识别引擎的准确性。数据集目前包含60种语言的7,335个已验证小时数,并且正在不断增加更多的语音和语言。
提供机构:
tommy19970714
原始信息汇总
数据集概述
名称: Common Voice 数据集
描述: Common Voice 数据集包含独特的MP3音频文件及其对应的文本文件。数据集中有9,283小时的录音,其中7,335小时已验证,涵盖60种语言。此外,数据集还包含年龄、性别和口音等人口统计元数据,有助于提高语音识别引擎的准确性。
语言: 英语
数据结构:
- 音频文件: MP3格式
- 文本文件: 对应音频内容
- 元数据: 包括年龄、性别、口音等
使用注意事项:
- 数据集中的语音捐赠者身份应保密,不得尝试确定其身份。
其他信息:
- 数据集仍在不断增加新的语音和语言。
- 请求新语言或开始贡献,可访问相关页面。



