five

腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/teng_xun_ci_xiang_liang_Tencent_AI_etc
下载链接
链接失效反馈
官方服务:
资源简介:
这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。
提供机构:
OpenDataLab
创建时间:
2023-03-30
二维码
社区交流群
二维码
科研交流群
商业服务