five

中文预训练词向量(百度百科 word2vec +Ngram)

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/6592
下载链接
链接失效反馈
官方服务:
资源简介:
<P>中文预训练词向量北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源的"chinese-word-vectors。github链接为:<A href="https://github.com/Embedding/Chinese-Word-Vectors">https://github.com/Embedding/Chinese-Word-Vectors</A>。</P> <P>此中文预训练词向量为百度百科Word + Ngram的词向量,可以直接从<A href="https://github.com/Embedding/Chinese-Word-Vectors下载。">https://github.com/Embedding/Chinese-Word-Vectors下载。</A></P>

本中文预训练词向量(chinese-word-vectors)由北京师范大学中文信息处理研究所与中国人民大学DBIIR实验室的研究者开源发布,其GitHub仓库链接为:https://github.com/Embedding/Chinese-Word-Vectors。 该预训练词向量为基于百度百科语料的Word+Ngram词向量,可直接从上述GitHub仓库链接下载。
提供机构:
阿里云天池
创建时间:
2018-11-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是中文预训练词向量,基于百度百科的Word + Ngram训练,由北京师范大学和中国人民大学的研究者开源。提供了详细的下载和使用方法,适用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务