Crowdsourced English Temporal Dependency Tree (TDT) Corpus
收藏数据集概述
数据集名称
Crowdsourced English Temporal Dependency Tree (TDT) Corpus
数据集内容
该数据集包含英语新闻文章,这些文章被标注有时间表达式、事件及时间关系。时间关系以依赖树结构形式表示,每篇文章对应一个依赖树结构。
数据集来源
该数据集基于Timebank corpus构建,通过众包方式收集时间依赖树标注。此外,还包括Timebank Dense corpus的一个小部分,由专家标注时间依赖树。
数据集组成部分
timebank-dense.expert.tdt: 专家标注的时间依赖树,涉及Timebank Dense corpus的36个文档。timebank.crowd.tdt: 众包标注的时间依赖树,覆盖Timebank corpus的全部183个文档。
数据集格式
- 文件类型:
.tdt - 结构:每行代表一个子-父对,包含9个字段,字段间以制表符分隔。
- 字段说明:
- filename: 文件ID
- cSnt: 子句的句子ID
- cStart: 子句的起始词ID
- cEnd: 子句的结束词ID
- cLabel: 子句的时间表达式或事件标签
- pSnt: 父句的句子ID
- pStart: 父句的起始词ID
- pEnd: 父句的结束词ID
- trLabel: 子-父对之间的时间关系标签
引用信息
-
作者:Yuchen Zhang and Nianwen Xue
-
标题:Acquiring Structured Temporal Representation via Crowdsourcing: A Feasibility Study
-
会议:Eighth Joint Conference on Lexical and Computational Semantics (*SEM-2019)
-
年份:2019
-
引用格式:
@inproceedings{zhang2019acquiring, title={Acquiring structured temporal representation via crowdsourcing: A feasibility study}, author={Zhang, Yuchen and Xue, Nianwen}, booktitle={Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (* SEM 2019)}, pages={178--185}, year={2019} }




