five

ECB+ (extension to the EventCorefBank)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/ECB_plus
下载链接
链接失效反馈
官方服务:
资源简介:
ECB+ 语料库是 EventCorefBank 的扩展(ECB,Bejan 和 Harabagiu,2010)。一个新添加的语料库组件由 502 个文档组成,这些文档属于欧洲央行的 43 个主题,但描述的开创性事件与欧洲央行已经捕获的不同。所有语料库文本都是通过谷歌搜索找到的,并带有事件及其时间、地点、人类和非人类参与者的提及以及文档内和跨文档事件和实体的共同参考信息的注释。根据 ECB+ 注释指南,ECB 语料库的 2012 版注释 (Lee et al., 2012) 被用作重新注释 ECB 的起点。 与 2012 版欧洲央行注释的主要区别在于: (a) 五个事件组件在文本中进行了注释: 动作(以 ACTION 和 NEG 开头的注释标签) 时间(以 TIME 开头的注释标签) 位置(以 LOC 开头的注释标签) 人类参与者(以 HUMAN 开头的注释标签) 非人类参与者(以 NON_HUMAN 开头的注释标签) (b) 根据 ACE 注释指南 (LDC 2008)、TimeML (Pustejovsky et al., 2003 和 Sauri et al., 2003 和 Sauri et al.) 为五个主要事件组件中的每一个区分特定的动作类和实体子类型,从而产生 30 个注释标签的总标签集., 2005) (c) 建立了五个事件组成部分的提及之间的文件内和跨文件共指关系: INTRA_DOC_COREF 标记在不参与跨文档关系的文档共指链中捕获;通过 CAT 工具对文档内的共指进行了注释(Bartalesi et al., 2012) CROSS_DOC_COREF 标签表示在 CROMER 工具中创建的跨文档共指关系 (Girardi et al., 2014);所有共指分支都通过关系目标 ID 指向所谓的 TAG_DESCRIPTORS,指向人类友好的实例名称(由编码人员分配)以及 instance_id-s (d) 从“以事件为中心”的角度对事件进行注释,即根据提及在事件中所扮演的角色分配注释标签(有关更多信息,请参阅 ECB+ 参考资料)。
提供机构:
OpenDataLab
创建时间:
2022-06-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作