Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset

Name: Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset
Creator: Nexdata
Published: 2024-04-15 09:47:56
License: 暂无描述

Hugging Face2024-04-15 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

越南自发对话电话语音数据集，包含基于特定主题的对话，转录内容包括文本、时间戳、说话者ID、性别等属性。数据集来自1200多名越南本土说话者，地理分布广泛，以提高模型在真实复杂任务中的表现。数据集经过多家AI公司的质量测试，并严格遵守数据保护法规和隐私标准。数据格式为8kHz, 8bit, u-law/a-law wav，单声道，录制环境为安静的室内环境，无回声。数据集适用于语音识别和声纹识别等应用场景，单词准确率达到98%。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集描述

名称：Vietnamese Spontaneous Dialogue Telephony speech dataset
内容：包含基于特定话题的越南语自发对话，对话内容已转录，包括文本、时间戳、说话人ID、性别等属性。
规模：超过1200名越南本地说话人参与。
质量：经过多家AI公司质量测试。
合规性：遵守数据保护法规和隐私标准，符合GDPR、CCPA、PIPL。

数据格式

音频格式：8kHz, 8bit, u-law/a-law wav, 单声道。
录制条件：安静的室内环境，无回声。

内容分类

话题数量：数十个指定话题，说话人在这些话题下进行对话并录音。

说话人信息

总数：1,234名越南本地说话人。
性别比例：男性53%，女性47%。

标注特征

包含信息：转录文本、时间戳、说话人ID和性别。

录制设备

设备：电话录音系统。

语言信息

语言：越南语。
地区代码：vi-VN。
国家：越南（VNM）。

应用场景

用途：语音识别；声纹识别。

准确率

字准确率：98%。

许可信息

许可类型：商业许可。

5,000+

优质数据集

54 个

任务类型

进入经典数据集