five

Moosieus/commonvoice_17_0_en_codec2

收藏
Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Moosieus/commonvoice_17_0_en_codec2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Mozilla的common_voice数据集的一个分支,经过了codec2编码处理,比特率为3200。

Common Voice Corpus 17.0 (EN codec2) is a fork of the common_voice dataset from Mozilla processed through codec2 at 3200 bits. The dataset is crowdsourced, in English, and licensed under CC0-1.0. It is multilingual and extends from the common_voice source dataset. Additionally, users must agree not to attempt to determine the identity of speakers in the dataset when accessing it.
提供机构:
Moosieus
原始信息汇总

数据集卡片:Common Voice Corpus 17.0 (EN codec2)

基本信息

  • 数据集名称: Common Voice Corpus 17.0 (EN codec2)
  • 语言: 英语 (en)
  • 多语言性: 多语言
  • 许可证: CC0-1.0
  • 数据来源: 扩展自 Common Voice 数据集
  • 数据创建者: 众包
  • 注释创建者: 众包

引用信息

@inproceedings{commonvoice:2020, author = {Ardila, R. and Branson, M. and Davis, K. and Henretty, M. and Kohler, M. and Meyer, J. and Morais, R. and Saunders, L. and Tyers, F. M. and Weber, G.}, title = {Common Voice: A Massively-Multilingual Speech Corpus}, booktitle = {Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020)}, pages = {4211--4215}, year = 2020 }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作