five

粤语ASR标注

收藏
魔搭社区2024-11-08 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/LONGMAOSOFT/Cantonese-dialect-conversation
下载链接
链接失效反馈
官方服务:
资源简介:
免费开源216GB粤语数据集,本平台提供的是样例数据集,完整数据集请到huggingface下载,下载地址:https://huggingface.co/datasets/longmaodata/Cantonese-ASR

Free and open-source 216 GB Cantonese dataset. This platform only provides a sample subset of the full dataset. The complete dataset can be downloaded from Hugging Face via the following link: https://huggingface.co/datasets/longmaodata/Cantonese-ASR
提供机构:
maas
创建时间:
2024-11-08
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个粤语口语对话数据集,总数据量为655小时,由228位收集者录制,涵盖客服对话、金融行业等多种场景。音频以8k、16bit wav格式存储,标注内容包括时间戳、性别和背景噪音等信息。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作