Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset
下载链接
链接失效反馈官方服务:
资源简介:
越南自发对话电话语音数据集,包含基于特定主题的对话,转录内容包括文本、时间戳、说话者ID、性别等属性。数据集来自1200多名越南本土说话者,地理分布广泛,以提高模型在真实复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准。数据格式为8kHz, 8bit, u-law/a-law wav,单声道,录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景,单词准确率达到98%。
越南自发对话电话语音数据集,包含基于特定主题的对话,转录内容包括文本、时间戳、说话者ID、性别等属性。数据集来自1200多名越南本土说话者,地理分布广泛,以提高模型在真实复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准。数据格式为8kHz, 8bit, u-law/a-law wav,单声道,录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景,单词准确率达到98%。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集描述
- 名称:Vietnamese Spontaneous Dialogue Telephony speech dataset
- 内容:包含基于特定话题的越南语自发对话,对话内容已转录,包括文本、时间戳、说话人ID、性别等属性。
- 规模:超过1200名越南本地说话人参与。
- 质量:经过多家AI公司质量测试。
- 合规性:遵守数据保护法规和隐私标准,符合GDPR、CCPA、PIPL。
数据格式
- 音频格式:8kHz, 8bit, u-law/a-law wav, 单声道。
- 录制条件:安静的室内环境,无回声。
内容分类
- 话题数量:数十个指定话题,说话人在这些话题下进行对话并录音。
说话人信息
- 总数:1,234名越南本地说话人。
- 性别比例:男性53%,女性47%。
标注特征
- 包含信息:转录文本、时间戳、说话人ID和性别。
录制设备
- 设备:电话录音系统。
语言信息
- 语言:越南语。
- 地区代码:vi-VN。
- 国家:越南(VNM)。
应用场景
- 用途:语音识别;声纹识别。
准确率
- 字准确率:98%。
许可信息
- 许可类型:商业许可。



