Nexdata/French_Speech_Data_by_Mobile_Phone_Reading
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/French_Speech_Data_by_Mobile_Phone_Reading
下载链接
链接失效反馈官方服务:
资源简介:
该数据集的容量为231小时,由406位来自法国、加拿大和非洲的说话者录制。录音在安静的环境中进行,内容丰富,涵盖经济、娱乐、新闻和口语等多个领域。所有文本均经过人工转录,句子准确率达到95%。该数据集可用于自动语音识别(ASR)和音频说话者识别任务。
This dataset has a total duration of 231 hours, recorded by 406 speakers from France, Canada and Africa. The recordings were conducted in quiet environments, with rich content covering multiple domains including economy, entertainment, news and spontaneous spoken language. All texts have been manually transcribed, achieving a sentence-level accuracy of 95%. This dataset can be used for automatic speech recognition (ASR) and audio speaker recognition tasks.
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
数据集总结
- 数据量:231小时
- 发言人数量:406人
- 来源地区:法国、加拿大、非洲
- 录音环境:安静
- 内容丰富度:包含经济、娱乐、新闻、口语等多个领域
- 文本转录:手动转录
- 句子准确率:95%
支持的任务和排行榜
- 任务:自动语音识别(ASR)、音频发言人识别
语言
- 语言:法语
数据集结构
数据实例
- 信息:待补充
数据字段
- 信息:待补充
数据分割
- 信息:待补充
数据集创建
数据选择理由
- 信息:待补充
源数据
初始数据收集和标准化
- 信息:待补充
源语言生产者
- 信息:待补充
注释
注释过程
- 信息:待补充
注释者
- 信息:待补充
个人和敏感信息
- 信息:待补充
使用数据的考虑
数据集的社会影响
- 信息:待补充
偏见的讨论
- 信息:待补充
其他已知限制
- 信息:待补充
附加信息
数据集管理者
- 信息:待补充
许可信息
- 许可类型:商业许可
- 许可链接:商业许可
引用信息
- 信息:待补充
贡献
- 信息:待补充



