Nexdata/Indonesian_Speech_Data_by_Mobile_Phone_Reading
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Indonesian_Speech_Data_by_Mobile_Phone_Reading
下载链接
链接失效反馈官方服务:
资源简介:
印尼语音数据(阅读)是从496名印尼母语者中收集的,并在安静的环境中录制。录音内容丰富,涵盖经济、娱乐、新闻、人物、信件和口语等多个类别。每个说话者大约有400个句子。有效数据量为360小时。所有文本均为高精度手动转录。该数据集可用于自动语音识别(ASR)和音频说话人识别任务。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
Nexdata/Indonesian_Speech_Data_by_Mobile_Phone_Reading
数据集描述
数据集总结
- 语言: 印尼语
- 来源: 由496名印尼本土演讲者提供
- 环境: 安静环境下录制
- 内容: 涵盖经济、娱乐、新闻、人物、字母、口语等多个类别
- 数据量: 约400句/演讲者,总有效数据量为360小时
- 文本转录: 人工转录,高准确度
支持的任务和排行榜
- 任务: 自动语音识别 (ASR), 音频说话人识别
数据集结构
数据实例
- 信息: 待补充
数据字段
- 信息: 待补充
数据分割
- 信息: 待补充
数据集创建
来源数据
- 语言生产者: 待补充
注释
- 注释者: 待补充
个人和敏感信息
- 信息: 待补充
使用数据的考虑
数据集的社会影响
- 信息: 待补充
偏见讨论
- 信息: 待补充
其他已知限制
- 信息: 待补充
附加信息
数据集管理者
- 信息: 待补充
许可信息
- 许可类型: 商业许可
- 许可链接: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
引用信息
- 信息: 待补充



