SentiBridge: 中文实体情感知识库
收藏Data Castle2022-02-22 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=1383
下载链接
链接失效反馈官方服务:
资源简介:
#### 背景描述
本词典包含:实体/属性—情感词。例如:“长城 宏伟”、“性价比 高”、“价格 高”。主要目的是刻画人们是怎么描述某个实体的,例如大家通常用 宏伟 来形容长城。
目前词典包含三个领域语料的抽取结果:新闻、旅游、餐饮,共计30万对。
#### 数据说明
每个文件夹中包含两种文件
前缀pair_sort代表排序得到的结果:
pair_sort_[m,n],指的是从m%到n%的排序部分
数据形式是:实体/属性 情感词 收敛分数
前缀pair_mine代表提炼得到的结果:
数据形式是:实体/属性 情感词 相似度分数1 相似度分数2
pair_mine后面的数字是提炼算法得到的结果中,保证正确率取的分数值。即文本中所有分数1和2,都必须高于该值并保留的结果
#### 数据来源
SentiBridge数据仅供学术研究使用,商用请联系我们(wlchen at suda.edu.cn)获取授权。
相关文献
卢奇, 陈文亮. 大规模中文实体情感知识的自动获取, 中文信息学报, 32 (8): 32-41, 2018年8月
LU Qi, CHEN Wenliang, Automatically Building a Large Scale Dictionary of Chinese Entity Sentiment Expressions, Journal of Chinese Information Processing, 32 (8): 32-41, 2018-8.
#### 问题描述
该数据能解决什么问题?适用于什么场景
提供机构:
TAOZI007



