319,977条汉语多音字语料数据
收藏数据堂2024-05-23 收录
下载链接:
https://www.datatang.com/dataset/1036
下载链接
链接失效反馈官方服务:
资源简介:
汉语多音字语料数据是为多音字读音消歧所设计的语料库,本套数据中包含603个字音,语料句数根据字音实际词组数量不同而有所差异。
The Chinese polyphonic character corpus is a dedicated dataset designed for polyphonic character pronunciation disambiguation. This corpus includes 603 distinct pronunciations of polyphonic characters, and the number of corpus sentences varies based on the actual number of word phrases corresponding to each pronunciation.
提供机构:
数据堂
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含319,977句汉语多音字语料的大型语料库,涵盖603个字音,主要用于多音字读音消歧任务。数据来源多样,包括新闻和口语化句子,并标注了特定多音字的正确读音。
以上内容由遇见数据集搜集并总结生成



