five

关键短语抽取

收藏
海南省数据产品超市2023-12-19 更新2024-03-01 收录
下载链接:
https://www.datadex.cn/app/buyApi?id=cd5c71af9708453cbed8518e7a56f2c0
下载链接
链接失效反馈
官方服务:
资源简介:
针对某时间段内反应民情的工单数据,该能力可自动抽取其中的热点问题,传统的分词+统计的方法需要大量人工标注关键词。本能力采用基于信息熵和内部凝固度的词库构建算法,可方便快捷的实现无监督的词库建立,再通过语言模型的文本表征能力计算各个词或短语对于句子的重要性,从而抽取其中的关键词

Targeting work order data reflecting public sentiment within a specific time period, this capability can automatically extract hot issues from such data. Traditional tokenization-based statistical methods require extensive manual keyword annotation. This capability adopts a vocabulary construction algorithm based on information entropy and internal cohesion, enabling fast and convenient unsupervised vocabulary construction. Subsequently, it utilizes the text representation capability of language models to calculate the importance of each word or phrase to the corresponding sentence, thereby extracting the core keywords.
提供机构:
中国电信股份有限公司海南分公司-数据产品超市
创建时间:
2023-12-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供基于信息熵和内部凝固度的无监督词库构建算法,通过语言模型自动抽取工单数据中的热点关键词,替代传统人工标注方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作