five

PKU-SEGPOS

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/PKU-SEGPOS
下载链接
链接失效反馈
官方服务:
资源简介:
北京大学提供的词性标注数据集,用于标注人民日报语料库。 从2000年1月和12月1日到15,2000的语料库被用作训练集,从12月16日到2000年12月23日的语料库被用作开发集,从12月24日到2000年12月31日的语料库被用作训练集。作为测试集的语料库。 除了使用《现代汉语语法信息词典》中的26个词性标签 (名词n,时间词t,位置词s,位置词f,数字m,量词q,区分词b,代词r,动词v,形容词a,状态词z,副词d、介词p、连词c、粒子u、语气词y、感叹词e、拟声词o、成语i、成语l、缩写j、前成分h、后成分k、语素g、非语素x、标点符号w) 、增加了以下三种标记: ① 专有名词的分类标记,即人名nr,地名ns,组织名称nt,其他专有名词nz; ② 语素的子类标记,即名词语素Ng、动词语素Vg、形容词语素Ag、时态语素Tg、次语素Dg等; ③ 动词和形容词的子类标记,即名词动词vn (具有名词特征的动词),名词形容词an (具有名词特征的形容词),副词vd (具有副词特征的动词),副词ad (具有副词特征的形容词)。 总共大约40个左右。
提供机构:
OpenDataLab
创建时间:
2023-05-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作