Nexdata/Pinyin_Annotation_Speech_Data_of_Audio_Book_Text

Name: Nexdata/Pinyin_Annotation_Speech_Data_of_Audio_Book_Text
Creator: Nexdata
Published: 2024-04-17 06:06:58
License: 暂无描述

Hugging Face2024-04-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/Pinyin_Annotation_Speech_Data_of_Audio_Book_Text

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个包含35小时时长的有声书拼音音频数据，由5位说话者录制，包括3位男性和2位女性。数据集中标注了汉字和拼音，包括拼音的声调。该数据集可用于自动语音识别、机器翻译和声纹识别等任务。

This dataset consists of 35 hours of audiobook pinyin audio data, recorded by 5 speakers including 3 males and 2 females. The dataset is annotated with Chinese characters and pinyin, covering the lexical tones of the pinyin. It can be applied to tasks such as automatic speech recognition, machine translation, and speaker verification.

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集描述

数据集总结

类型: 有声书注音音频数据
时长: 35小时
发言人: 5人，包括3名男性和2名女性
内容: 包含汉字及其拼音注释，包括拼音的声调
应用: 适用于自动语音识别、机器翻译和声纹识别

支持的任务和排行榜

任务: 自动语音识别、音频发言人识别、机器翻译
用途: 用于训练自动语音识别（ASR）模型

语言

语言: 中文拼音

数据集结构

数据实例

信息: 待补充

数据字段

信息: 待补充

数据分割

信息: 待补充

数据集创建

来源数据

初始数据收集和标准化: 待补充
源语言生产者: 待补充

注释

注释过程: 待补充
注释者: 待补充

个人和敏感信息

信息: 待补充

使用数据的考虑

数据集的社会影响

信息: 待补充

偏见的讨论

信息: 待补充

其他已知限制

信息: 待补充

附加信息

数据集管理员

信息: 待补充

许可信息

许可类型: 商业许可
许可链接: 商业许可详情

引用信息

信息: 待补充

5,000+

优质数据集

54 个

任务类型

进入经典数据集