Nexdata/multi_language

Name: Nexdata/multi_language
Creator: Nexdata
Published: 2023-11-22 09:43:08
License: 暂无描述

Hugging Face2023-11-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/multi_language

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含25,000小时的多语言朗读语音数据，由母语者录制，涵盖英语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语、日语、韩语、印地语、越南语、他加禄语、泰语等多种语言。录音内容丰富，涵盖经济、娱乐、新闻、口语、数字和字母等多个类别。数据格式为16kHz, 16bit, 未压缩的wav文件，单声道。句子准确率超过95%。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集描述

数据集名称： multi_language
数据集概要： 包含25,000小时的多语言朗读语音数据，由母语者录制，涵盖英语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语、日语、韩语、印地语、越南语、他加禄语、泰语等。录音内容丰富，包括经济、娱乐、新闻、口语、数字和字母等多个类别。格式为16kHz, 16bit, 单声道wav文件。句子准确率超过95%。
支持的任务和排行榜： 自动语音识别（ASR）、音频说话人识别。
语言： 英语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语、日语、韩语、印地语、越南语、他加禄语、泰语等。