five

中国香港事件标签化数据集(2019-2020年)

收藏
国家地球系统科学数据中心2022-06-10 更新2024-03-04 收录
下载链接:
https://www.geodata.cn/data/datadetails.html?dataguid=85066495248441&docId=8294
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为中国香港事件标签化数据集。将中国香港事件原始数据集(2019-2020年)中全部文本数据进行标签化处理,采用自然语言处理技术分别对原始文本数据进行结构、类型、内容三方面的标签化处理。结构标签化主要用于解析原始文本的篇章结构,获得分段、分句、分词处理后的标签化数据。类型标签化主要用于解析原始文本的体裁、功能、领域等特征,并获得相应特征的标签化数据。内容标签化是对文本内容进行解析,抽取出时间、地点、人物、事物、事件等要素及要素的起始位置,并获得相应要素的标签化数据。数据以json格式进行存储。
提供机构:
南京师范大学
创建时间:
2022-06-10
二维码
社区交流群
二维码
科研交流群
商业服务