five

tommy19970714/common_voice

收藏
Hugging Face2021-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tommy19970714/common_voice
下载链接
链接失效反馈
官方服务:
资源简介:
Common Voice数据集由独特的MP3文件和相应的文本文件组成。数据集中的9,283个录音小时数中,许多还包括年龄、性别和口音等人口统计元数据,这些数据有助于训练语音识别引擎的准确性。数据集目前包含60种语言的7,335个已验证小时数,并且正在不断增加更多的语音和语言。
提供机构:
tommy19970714
原始信息汇总

数据集概述

名称: Common Voice 数据集

描述: Common Voice 数据集包含独特的MP3音频文件及其对应的文本文件。数据集中有9,283小时的录音,其中7,335小时已验证,涵盖60种语言。此外,数据集还包含年龄、性别和口音等人口统计元数据,有助于提高语音识别引擎的准确性。

语言: 英语

数据结构:

  • 音频文件: MP3格式
  • 文本文件: 对应音频内容
  • 元数据: 包括年龄、性别、口音等

使用注意事项:

  • 数据集中的语音捐赠者身份应保密,不得尝试确定其身份。

其他信息:

  • 数据集仍在不断增加新的语音和语言。
  • 请求新语言或开始贡献,可访问相关页面。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作