five

Nexdata | Multilingual Children Speech Data| 10,000 Hours | AI & ML Training Data | Speech Recognition Data| Audio Data

收藏
Datarade2024-04-19 收录
下载链接:
https://datarade.ai/data-products/nexdata-multilingual-children-speech-data-10-000-hours-nexdata
下载链接
链接失效反馈
官方服务:
资源简介:
1. Specifications Format : 16kHz/22.05kHz/44.1kHz, 16bit, uncompressed wav, mono channel Recording environment : quiet indoor environment, without echo Recording content (read speech) : children's books; human-machine interaction category; smart home command and control category; numbers; general category Speaker : children of 5-12 years old,gender balance Device: microphone,mobile phone Language : English,Mandarin, Korean, Japanese,German, French, Italian, Russian, Portuguese, Turkish, Dutch, Swedish, Norwegian, Finnish, Hungarian, Thai, Hindi, Indonesian, Vietnamese, Malay, Burmese, Filipino(Tagalog) Transcription content : text Application scenarios : speech recognition; voiceprint recognition Accuracy rate : sentence accuracy rate 95% 2. About Nexdata Nexdata owns off-the-shelf 200,000 hours of speech recognition data, 800TB of Annotated Imagery Data, about 2 billion pieces of Natural Language Processing (NLP) Data. These ready-to-go Natural Language Processing (NLP) Data support instant delivery, quickly improve the accuracy of AI models. For more details, please visit us at https://www.nexdata.ai/speechRecognition?source=Datarade

1. 音频规格:采样率涵盖16kHz、22.05kHz、44.1kHz,位深16bit,采用未压缩WAV格式,单声道录制。 录制环境:无回声的安静室内环境。 录制内容(朗读语音):包含儿童读物朗读语音、人机交互类语音、智能家居操控指令类语音、数字语音以及通用类语音内容。 发声主体:5至12岁儿童,性别比例均衡。 采集设备:麦克风、移动电话。 支持语言:英语、普通话、韩语、日语、德语、法语、意大利语、俄语、葡萄牙语、土耳其语、荷兰语、瑞典语、挪威语、芬兰语、匈牙利语、泰语、印地语、印尼语、越南语、马来语、缅甸语、他加禄语(菲律宾语)。 转写内容:文本形式。 应用场景:语音识别、声纹识别。 准确率:句子级别准确率可达95%。 2. 关于Nexdata Nexdata拥有现成可用的20万小时语音识别数据集、800TB标注图像数据集,以及约20亿条自然语言处理(Natural Language Processing, NLP)数据。此类可直接投入使用的自然语言处理数据支持即时交付,能够快速提升AI模型的识别精度。如需了解更多详情,请访问:https://www.nexdata.ai/speechRecognition?source=Datarade
提供机构:
Nexdata
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作