粤语ASR标注
收藏魔搭社区2024-11-08 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/LONGMAOSOFT/Cantonese-dialect-conversation
下载链接
链接失效反馈官方服务:
资源简介:
免费开源216GB粤语数据集,本平台提供的是样例数据集,完整数据集请到huggingface下载,下载地址:https://huggingface.co/datasets/longmaodata/Cantonese-ASR
Free and open-source 216 GB Cantonese dataset. This platform only provides a sample subset of the full dataset. The complete dataset can be downloaded from Hugging Face via the following link: https://huggingface.co/datasets/longmaodata/Cantonese-ASR
提供机构:
maas
创建时间:
2024-11-08
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个粤语口语对话数据集,总数据量为655小时,由228位收集者录制,涵盖客服对话、金融行业等多种场景。音频以8k、16bit wav格式存储,标注内容包括时间戳、性别和背景噪音等信息。
以上内容由遇见数据集搜集并总结生成



