five

未明确命名

收藏
arXiv2019-05-16 更新2024-06-21 收录
下载链接:
http://toAppear
下载链接
链接失效反馈
官方服务:
资源简介:
本研究基于Stanford Question Answering Dataset (SQuADv1.1) 和 NewsQA,创建了一个用于隐式关系开放信息提取的大型数据集。该数据集包含107595条数据,主要来源于阅读理解任务,通过解析工具将问题答案对转换为开放信息提取数据集。数据集的创建过程涉及使用依赖解析器和15条规则来处理输入的问题答案对,输出隐式关系三元组。该数据集旨在提高开放信息提取系统对隐式关系的召回率,适用于自然语言理解等下游应用。

This study constructs a large-scale dataset for implicit relation open information extraction based on the Stanford Question Answering Dataset (SQuADv1.1) and NewsQA. The dataset contains 107,595 instances, which are mainly derived from reading comprehension tasks, and the question-answer pairs are converted into open information extraction datasets via parsing tools. The dataset construction process involves using a dependency parser and 15 rules to process the input question-answer pairs and output implicit relation triples. This dataset aims to improve the recall rate of implicit relations for open information extraction systems, and is applicable to downstream natural language understanding applications.
提供机构:
宾夕法尼亚大学沃顿商学院
创建时间:
2019-05-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作