关键短语抽取
收藏海南省数据产品超市2023-12-19 更新2024-03-01 收录
下载链接:
https://www.datadex.cn/app/buyApi?id=cd5c71af9708453cbed8518e7a56f2c0
下载链接
链接失效反馈官方服务:
资源简介:
针对某时间段内反应民情的工单数据,该能力可自动抽取其中的热点问题,传统的分词+统计的方法需要大量人工标注关键词。本能力采用基于信息熵和内部凝固度的词库构建算法,可方便快捷的实现无监督的词库建立,再通过语言模型的文本表征能力计算各个词或短语对于句子的重要性,从而抽取其中的关键词
Targeting work order data reflecting public sentiment within a specific time period, this capability can automatically extract hot issues from such data. Traditional tokenization-based statistical methods require extensive manual keyword annotation. This capability adopts a vocabulary construction algorithm based on information entropy and internal cohesion, enabling fast and convenient unsupervised vocabulary construction. Subsequently, it utilizes the text representation capability of language models to calculate the importance of each word or phrase to the corresponding sentence, thereby extracting the core keywords.
提供机构:
中国电信股份有限公司海南分公司-数据产品超市
创建时间:
2023-12-19
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集提供基于信息熵和内部凝固度的无监督词库构建算法,通过语言模型自动抽取工单数据中的热点关键词,替代传统人工标注方法。
以上内容由遇见数据集搜集并总结生成



