five

海天瑞声-中国中英混识别语音库(桌面)

收藏
魔搭社区2025-09-04 更新2024-06-08 收录
下载链接:
https://modelscope.cn/datasets/haitianruisheng/ChineseandEnglishmixedSpeechRecognitionCorpusDesktop
下载链接
链接失效反馈
官方服务:
资源简介:
在安静的桌面环境中录制,音频质量高,男女发音人比例均衡。包含中国七大方言区的发音人,具有很好的地域覆盖性,有助于提高模型对不同方言口音的识别能力。内容包括音乐、地图、闲聊、中式英语交互、生活查询、百科、工具、应用控制、电台、有声书、视频等多种场景。

Recorded in a quiet desktop environment with high audio fidelity, the dataset maintains a balanced proportion of male and female speakers. It encompasses speakers from seven major Chinese dialect regions, ensuring excellent geographic coverage and effectively enhancing the model's capability to recognize various dialectal accents. The dataset covers diverse scenarios including music, map-related interactions, casual small talk, Chinese-English bilingual interactions, daily life queries, encyclopedic content, tool operations, application control, radio programs, audiobooks, and video content.
提供机构:
maas
创建时间:
2024-06-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集在安静桌面环境下录制,音频质量高,包含2500名说话人,男女比例均衡,并涵盖中国七大主要方言区,以提升模型对不同方言口音的识别能力。总时长3200小时,格式为16KHz/16bit的WAV音频,适用于大型语音模型的测试与训练,内容覆盖音乐、地图、日常对话等多种实际场景。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务