Nexdata/136_Hours_Korean_Conversational_Speech_Data_by_Telephone
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/136_Hours_Korean_Conversational_Speech_Data_by_Telephone
下载链接
链接失效反馈官方服务:
资源简介:
韩国自发对话电话语音数据集,基于给定主题的对话收集,涵盖20多个领域。数据集包括文本内容、说话者ID、性别、年龄等属性的转录。数据集由216名母语者广泛且多样化地收集,地理上分布广泛,增强了模型在真实和复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。
韩国自发对话电话语音数据集,基于给定主题的对话收集,涵盖20多个领域。数据集包括文本内容、说话者ID、性别、年龄等属性的转录。数据集由216名母语者广泛且多样化地收集,地理上分布广泛,增强了模型在真实和复杂任务中的表现。数据集经过多家AI公司的质量测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。
提供机构:
Nexdata
原始信息汇总
数据集概述
基本信息
- 名称: Korean(Korea) Spontaneous Dialogue Telephony speech dataset
- 描述: 该数据集包含基于给定话题的韩国电话自发对话,覆盖20多个领域。数据由216名本土发言人提供,性别分布为44%男性,56%女性。
- 语言: 韩语(ko-KR)
- 国家: 韩国(KOR)
- 录音条件: 低背景噪声(室内)
- 录音设备: 电话
数据格式
- 采样率: 8kHz
- 位深度: 8bit
- 编码: a-law/u-law pcm
- 声道: 单声道
内容分类
- 类别: 基于给定话题的对话
标注特征
- 包含: 转录文本、时间戳、发言人ID、性别
- 准确率: 句子准确率(SAR)95%
许可证
- 类型: 商业许可证
- 遵守法规: GDPR, CCPA, PIPL



