供应商动态新闻事件抽取语料集
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc799bb16e07753c34c77&type=1
下载链接
链接失效反馈官方服务:
资源简介:
该语料集主要给出关于核电制造企业供应链节点供应商企业的经营状态新闻事件,为事件抽取方法研究提供数据支持,总共有1250个句子。每个句子都是单独进行标注的。文件标注的格式是bio格式,其将每个元素标注为“B-X”、“I-X”或者“O”。其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。比如,我们将 X 表示为名词短语(Noun Phrase, NP),则BIO的三个标记为:(1)B-NP:名词短语的开头(2)I-NP:名词短语的中间(3)O:不是名词短语。数据文件为txt文件、png图片,总计3个数据文件,数据量共1.24MB。
提供机构:
广东工业大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是针对核电制造企业供应链节点供应商的经营状态新闻事件构建的语料集,旨在为事件抽取方法研究提供数据支持。它包含1250个句子,每个句子均采用BIO格式进行独立标注,数据文件为txt和png格式,总计约1.24MB。
以上内容由遇见数据集搜集并总结生成



