Skit-S2I
收藏arXiv2022-12-26 更新2024-06-21 收录
下载链接:
https://github.com/skit-ai/speech-to-intent-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Skit-S2I数据集是由印度班加罗尔的Skit.ai机构创建,专注于银行领域的印度口音语音理解任务。该数据集包含11845条录音,通过电话在半控制环境下采集,涵盖14种粗粒度意图,每种意图平均有12个模板。数据集的创建旨在直接从语音信号预测说话者意图,避免使用自动语音识别(ASR)的中间文本转录,从而减少错误传播和提高模型优化效率。该数据集适用于开发和评估语音助手,特别是在处理印度口音的语音理解任务中,为解决现有数据集在口音和领域多样性上的不足提供了重要资源。
提供机构:
Skit.ai Bengaluru, 印度
创建时间:
2022-12-26



