five

GUM

收藏
arXiv2025-09-30 收录
下载链接:
https://gucorpling.org/gum/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个涵盖多种体裁的语篇树库,其中包括访谈、新闻故事、学术论文以及对话等12种不同类型。与RST-DT相似,该数据集并没有明确的人工标注的主题段落边界。其任务是进行话语解析。

This dataset is a discourse treebank that covers 12 distinct types of discourse, including interviews, news stories, academic papers, dialogues and others. Similar to RST-DT, this dataset does not have explicitly manually annotated topic paragraph boundaries, and its core task is discourse parsing.
提供机构:
GUM
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作