闽南语手机采集语音数据【数据堂】
收藏OpenDataLab2023-12-20 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang50
下载链接
链接失效反馈官方服务:
资源简介:
该数据由2,496名闽南方言发音人参与录制,覆盖泉州、漳州、台湾、厦门及其他地区。所有发音人均使用闽南语朗读文本,录音内容丰富,覆盖多个领域的客户咨询以及短信文本。句子由专业标注人员人工转写校对,准确率高。
This dataset was recorded by 2,496 Min Nan dialect informants recruited from regions including Quanzhou, Zhangzhou, Taiwan, Xiamen and other areas. All informants read texts in Min Nan, and the recorded content is diverse, covering customer inquiries and SMS texts across multiple domains. The sentences were manually transcribed and proofread by professional annotators, ensuring high annotation accuracy.
提供机构:
shujutang
创建时间:
2023-12-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集由数据堂提供,包含2,496名闽南方言发音人使用手机录制的闽南语语音,覆盖泉州、漳州、台湾、厦门等多个地区。录音内容涉及客户咨询和短信文本等多个领域,所有句子均经过专业标注人员人工转写校对,确保高准确率,但仅作为商业数据面向企业合作购买。
以上内容由遇见数据集搜集并总结生成



