Nexdata/Indonesian_Conversational_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Indonesian_Conversational_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个300小时的印度尼西亚语对话语音数据集,由约300名母语者通过手机录制。录音涵盖了多种话题,确保对话的流畅性和自然性。音频格式为16kHz、16bit、未压缩的WAV,所有录音均在安静的室内环境中进行。数据集包括手动转录的文本内容、每个有效句子的开始和结束时间以及说话者识别信息。适用于语音识别和声纹识别等应用场景。
This dataset is a 300-hour conversational speech dataset in Indonesian, recorded by approximately 300 native speakers using mobile phones. The recordings cover a wide range of topics to ensure the fluency and naturalness of the conversations. The audio is in uncompressed WAV format with specifications of 16kHz and 16-bit depth, and all recordings were conducted in quiet indoor environments. The dataset includes manually transcribed text content, the start and end timestamps of each valid sentence, and speaker identification information. It is suitable for application scenarios such as speech recognition and speaker verification.
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
300 Hours - Indonesian conversational speech data
收集方式
通过电话收集
参与者
约300名本地印尼语母语者
性别平衡
参与者性别比例平衡
对话内容
参与者从给定的话题列表中选择熟悉的话题进行对话,确保对话的流畅性和自然性
录音设备
多种移动电话
音频格式
- 采样率:16kHz
- 位深度:16bit
- 格式:未压缩的WAV格式
录音环境
安静的室内环境
数据处理
- 所有语音数据均手动转录
- 包含每句有效句子的起始和结束时间
- 包含说话者识别信息



