five

Shaip - Multilingual Conversational AI Training Data (Text & Audio)

收藏
Datarade2024-04-19 收录
下载链接:
https://datarade.ai/data-products/multilingual-conversational-ai-training-data-text-audio
下载链接
链接失效反馈
官方服务:
资源简介:
With our deep understanding of conversational AI, we helped the client source, curate, and transcribe the right set of data required to train their AI-enabled speech model, with utmost precision. We offered audio data collection and transcription services based on their requirements while fully customizing desired intent, utterances, and demographic distribution. Languages Supported: Afrikaans, Arabic, Bengali, Chinese Mandarin, Danish, Hebrew, Hindi, Indonesian, Kannada, Malay, Marathi, Swahili, Swedish, Telugu, Thai, Vietnamese, New Zealand English, South African English, Hindi - English (Hinglish), Singaporean English (Singlish), Indian English, Australian English, UK English, US English, US Spanish.

凭借对会话式人工智能(conversational AI)的深刻理解,我们以极致精度协助客户征集、甄选并转录训练其AI赋能语音模型所需的适配数据集。我们可根据客户需求提供音频数据采集与转录服务,并可针对预期对话意图、话语样本(utterances)以及人口分布特征进行全定制化调整。支持语言包括:南非荷兰语、阿拉伯语、孟加拉语、普通话(Chinese Mandarin)、丹麦语、希伯来语、印地语、印度尼西亚语、卡纳达语、马来语、马拉地语、斯瓦希里语、瑞典语、泰卢固语、泰语、越南语、新西兰英语、南非英语、印地语-英语(印式英语,Hinglish)、新加坡英语(新式英语,Singlish)、印度英语、澳大利亚英语、英国英语、美国英语、美国西班牙语。
提供机构:
ShAIp
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供多语言对话AI训练所需的文本和音频数据,涵盖25种语言及方言变体,支持定制化意图、话语和人口统计分布的数据采集与转录服务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作