OntoNotes Release 4.0
收藏DataCite Commons2024-05-08 更新2024-07-13 收录
下载链接:
https://fdat.uni-tuebingen.de/records/aqp3y-yat62
下载链接
链接失效反馈官方服务:
资源简介:
The OntoNotes project is a collaborative effort between BBN Technologies, the University of Colorado, the University of Pennsylvania, and the University of Southern California's Information Sciences Institute. The goal of the project is to annotate a large corpus comprising various genres of text (news, conversational telephone speech, weblogs, use net, broadcast, talk shows) in three languages (English, Chinese, and Arabic) with structural information (syntax and predicate argument structure) and shallow semantics (word sense linked to an ontology and coreference).
OntoNotes项目是由BBN科技公司、科罗拉多大学、宾夕法尼亚大学以及南加州大学信息科学研究所联合开展的协作研究项目。该项目的目标是为涵盖新闻、会话电话语音、博客、网络论坛(use net)、广播节目、脱口秀等多种文本体裁的大型语料库,基于英语、汉语及阿拉伯语三种语言,标注结构信息(句法(syntax)与谓词论元结构(predicate argument structure))以及浅层语义信息(关联至本体(ontology)的词义(word sense)与共指关系(coreference))。
提供机构:
University of Tübingen
创建时间:
2024-05-08
搜集汇总
数据集介绍

背景与挑战
背景概述
OntoNotes Release 4.0是一个多语言、多文本类型的语料库,包含英语、中文和阿拉伯语的多种文本类型,标注了结构信息和浅层语义。数据集由多个机构合作创建,访问受限。
以上内容由遇见数据集搜集并总结生成



