five

OntoNotes 5.0 Dataset

收藏
paperswithcode.com2025-03-23 收录
下载链接:
https://paperswithcode.com/dataset/ontonotes-5-0/
下载链接
链接失效反馈
官方服务:
资源简介:
OntoNotes 5.0 is a large corpus comprising various genres of text (news, conversational telephone speech, weblogs, usenet newsgroups, broadcast, talk shows) in three languages (English, Chinese, and Arabic) with structural information (syntax and predicate argument structure) and shallow semantics (word sense linked to an ontology and coreference). OntoNotes Release 5.0 contains the content of earlier releases - and adds source data from and/or additional annotations for, newswire, broadcast news, broadcast conversation, telephone conversation and web data in English and Chinese and newswire data in Arabic.

OntoNotes 5.0 是一个庞大的语料库,囊括了多种文类(新闻、对话电话语音、网络日志、USENET 新闻组、广播、脱口秀)的文本,涉及三种语言(英语、中文和阿拉伯语),并包含了结构信息(句法和谓语论元结构)以及浅层语义(词汇意义与本体论相关联,并具有指代性)。OntoNotes 发布版 5.0 包含了先前版本的全部内容,并补充了来自新闻通讯、广播新闻、广播对话、电话对话以及英语和中文网络数据的源数据,以及阿拉伯语的新闻通讯数据。
提供机构:
paperswithcode.com
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作