five

声云大规模多语种语料资源数据集

收藏
安徽省数据产权登记平台2026-05-22 收录
下载链接:
https://sjcqdj.ahdexc.com/certificate
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是一款大规模、高质量的多语种语音数据集,由多个子集构成,覆盖越南语、日语等语种,是国内稀缺的大规模多语种语音语料库。该数据集采用“标注数据+无监督数据”双轨结构,兼顾有监督训练与大模型预训练需求,数据形态完整、技术兼容性强,主要用于ASR(语音识别)大模型训练和预训练,训练后的模型可广泛应用于AI智能硬件语音能力部署及多语种语音服务等场景。
提供机构:
安徽声云智能科技有限公司
创建时间:
2026-05-21
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作