Nexdata | Multilingual Children Speech Data| 10,000 Hours | AI & ML Training Data | Speech Recognition Data| Audio Data
收藏Datarade2024-04-19 收录
下载链接:
https://datarade.ai/data-products/nexdata-multilingual-children-speech-data-10-000-hours-nexdata
下载链接
链接失效反馈官方服务:
资源简介:
1. Specifications Format : 16kHz/22.05kHz/44.1kHz, 16bit, uncompressed wav, mono channel Recording environment : quiet indoor environment, without echo Recording content (read speech) : children's books; human-machine interaction category; smart home command and control category; numbers; general category Speaker : children of 5-12 years old,gender balance Device: microphone,mobile phone Language : English,Mandarin, Korean, Japanese,German, French, Italian, Russian, Portuguese, Turkish, Dutch, Swedish, Norwegian, Finnish, Hungarian, Thai, Hindi, Indonesian, Vietnamese, Malay, Burmese, Filipino(Tagalog) Transcription content : text Application scenarios : speech recognition; voiceprint recognition Accuracy rate : sentence accuracy rate 95% 2. About Nexdata Nexdata owns off-the-shelf 200,000 hours of speech recognition data, 800TB of Annotated Imagery Data, about 2 billion pieces of Natural Language Processing (NLP) Data. These ready-to-go Natural Language Processing (NLP) Data support instant delivery, quickly improve the accuracy of AI models. For more details, please visit us at https://www.nexdata.ai/speechRecognition?source=Datarade
1. 音频规格:采样率涵盖16kHz、22.05kHz、44.1kHz,位深16bit,采用未压缩WAV格式,单声道录制。
录制环境:无回声的安静室内环境。
录制内容(朗读语音):包含儿童读物朗读语音、人机交互类语音、智能家居操控指令类语音、数字语音以及通用类语音内容。
发声主体:5至12岁儿童,性别比例均衡。
采集设备:麦克风、移动电话。
支持语言:英语、普通话、韩语、日语、德语、法语、意大利语、俄语、葡萄牙语、土耳其语、荷兰语、瑞典语、挪威语、芬兰语、匈牙利语、泰语、印地语、印尼语、越南语、马来语、缅甸语、他加禄语(菲律宾语)。
转写内容:文本形式。
应用场景:语音识别、声纹识别。
准确率:句子级别准确率可达95%。
2. 关于Nexdata
Nexdata拥有现成可用的20万小时语音识别数据集、800TB标注图像数据集,以及约20亿条自然语言处理(Natural Language Processing, NLP)数据。此类可直接投入使用的自然语言处理数据支持即时交付,能够快速提升AI模型的识别精度。如需了解更多详情,请访问:https://www.nexdata.ai/speechRecognition?source=Datarade
提供机构:
Nexdata



