illuin/common_voice_11_0_processed
收藏common_voice_11_0_processed
数据集描述
数据集概述
该数据集是从Huggingface Hub的mozilla-foundation/common_voice_11_0数据集处理得到的,配置为法语(fr)。
支持的任务和排行榜
[更多信息待补充]
语言
[更多信息待补充]
数据集结构
数据实例
[更多信息待补充]
数据字段
列
pathaudiosentencetaxonomytaxonomy_largesentence_processed
示例
json { "audio": { "array": [0.0, 0.0, 0.0, ..., -6.10351562e-05, -6.10351562e-05, 0.0], "path": None, "sampling_rate": 16000 }, "path": "/home/brunohays/.cache/huggingface/datasets/downloads/extracted/e95cbf12249133734218c89e4b09426a7807adcae4a709e56bc54e89ec65bc58/common_voice_fr_27787676.mp3", "sentence": "Il collaborera aussi avec Alan Bennett sur différentes comédies et téléfilm dramatiques.", "sentence_processed": "il collaborera aussi avec alan bennett sur différentes comédies et téléfilm dramatiques", "taxonomy": "common_voice", "taxonomy_large": "common_voice" }
数据分割
| 分割 | 行数 |
|---|---|
| train | 487011 |
| test | 15611 |
数据集创建
策划理由
[更多信息待补充]
源数据
[更多信息待补充]
注释
[更多信息待补充]
个人和敏感信息
[更多信息待补充]
使用数据集的考虑因素
偏见讨论
[更多信息待补充]
其他已知限制
[更多信息待补充]
附加信息
数据集策展人
[更多信息待补充]
许可信息
属于Illuin Technology
贡献
该数据集是通过illuin-hf-dataset-pusher仓库推送的。



