five

Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset

收藏
Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Vietnamese_Spontaneous_Dialogue_Telephony_speech_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
越南自发对话电话语音数据集,包含基于特定主题的对话,转录内容包括文本、时间戳、说话者ID、性别等属性。数据集来自1200多名越南本土说话者,地理分布广泛,以提高模型在真实复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准。数据格式为8kHz, 8bit, u-law/a-law wav,单声道,录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景,单词准确率达到98%。

越南自发对话电话语音数据集,包含基于特定主题的对话,转录内容包括文本、时间戳、说话者ID、性别等属性。数据集来自1200多名越南本土说话者,地理分布广泛,以提高模型在真实复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准。数据格式为8kHz, 8bit, u-law/a-law wav,单声道,录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景,单词准确率达到98%。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 名称:Vietnamese Spontaneous Dialogue Telephony speech dataset
  • 内容:包含基于特定话题的越南语自发对话,对话内容已转录,包括文本、时间戳、说话人ID、性别等属性。
  • 规模:超过1200名越南本地说话人参与。
  • 质量:经过多家AI公司质量测试。
  • 合规性:遵守数据保护法规和隐私标准,符合GDPR、CCPA、PIPL。

数据格式

  • 音频格式:8kHz, 8bit, u-law/a-law wav, 单声道。
  • 录制条件:安静的室内环境,无回声。

内容分类

  • 话题数量:数十个指定话题,说话人在这些话题下进行对话并录音。

说话人信息

  • 总数:1,234名越南本地说话人。
  • 性别比例:男性53%,女性47%。

标注特征

  • 包含信息:转录文本、时间戳、说话人ID和性别。

录制设备

  • 设备:电话录音系统。

语言信息

  • 语言:越南语。
  • 地区代码:vi-VN。
  • 国家:越南(VNM)。

应用场景

  • 用途:语音识别;声纹识别。

准确率

  • 字准确率:98%。

许可信息

  • 许可类型:商业许可。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作