关键短语抽取
收藏海南省公共数据授权运营-海南省数据产品超市2024-08-22 收录
下载链接:
https://transaction.datadex.cn/app/buyApi?id=cd5c71af9708453cbed8518e7a56f2c0
下载链接
链接失效反馈官方服务:
资源简介:
针对某时间段内反应民情的工单数据,该能力可自动抽取其中的热点问题,传统的分词+统计的方法需要大量人工标注关键词。本能力采用基于信息熵和内部凝固度的词库构建算法,可方便快捷的实现无监督的词库建立,再通过语言模型的文本表征能力计算各个词或短语对于句子的重要性,从而抽取其中的关键词
Targeting work order data reflecting public sentiment over a given time period, this capability enables automatic extraction of hot issues from such datasets. Traditional word segmentation plus statistical approaches require extensive manual keyword annotation. This capability adopts a vocabulary construction algorithm based on information entropy and internal cohesion, allowing for fast and convenient unsupervised vocabulary construction. Subsequently, it leverages the text representation capability of language models to calculate the importance of each word or phrase to the corresponding sentence, thereby extracting the core keywords from the data.
提供机构:
中国电信股份有限公司海南分公司-数据产品超市
创建时间:
2023-12-19
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集提供基于信息熵和内部凝固度算法的无监督词库构建方法,通过语言模型分析文本表征,实现工单数据中关键短语的自动抽取。
以上内容由遇见数据集搜集并总结生成



