five

GUM(Georgetown University Multilayer corpus)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/GUM
下载链接
链接失效反馈
官方服务:
资源简介:
GUM 是一个开源的多层英语语料库,包含来自 12 种文本类型的丰富注释文本。注释包括: 多个 POS 标签、形态特征和词形还原 句子分割和粗略的言语行为 TEI XML 中的文档结构(段落、标题、图形等) ISO 日期/时间注释 说话者和收件人信息(如果相关) 成分和依赖句法信息状态(给定的、可访问的、新的、拆分的先行词) 实体和共指注释,包括桥接照应实体链接(维基化) 修辞结构理论中的话语解析和话语依赖
提供机构:
OpenDataLab
创建时间:
2022-08-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作