five

ARP Corpus

收藏
github2018-11-04 更新2024-05-31 收录
下载链接:
https://github.com/preisert/deep-arg-structure-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
ARP语料库由一系列预定义的论证关系解释模式组成,覆盖了大多数解释。该语料库在arg-microtext语料库的基础上进行了深入的结构标注,用于论证关系,实现了良好的标注者一致性。

The ARP corpus consists of a series of predefined argumentative relation explanation patterns, covering the majority of explanations. This corpus has undergone in-depth structural annotation based on the arg-microtext corpus, specifically for argumentative relations, achieving excellent annotator consistency.
创建时间:
2017-05-25
原始信息汇总

Argument Reasoning Pattern (ARP) Corpus

数据集概述

  • 目的: 用于解释论证关系的预定义模式列表,覆盖了大多数解释情况。
  • 结构: 在arg-microtext corpus基础上进行深度结构标注,用于论证关系。
  • 标注工具: 使用brat进行标注,采用brat standoff格式。

数据内容

  • 开发集(dev): 包含20个已标注的arg-microtext corpus文本,用于创建最终实验中使用的模板。
  • 测试集(test): 包含69个已标注的arg-microtext corpus文本,用于评估模板的可行性。

引用信息

若使用此数据集,请引用:

  • Paul Reisert, Naoya Inoue, Tatsuki Kuribayashi, Kentaro Inui. Feasible Annotation Scheme for Capturing Policy Argument Reasoning using Argument Templates. In Proceedings of the 5th Workshop on Argument Mining. pp. 79-89. November 2018.
搜集汇总
数据集介绍
main_image_url
构建方式
ARP语料库的构建是基于预先定义的论证关系解释模式列表,这些模式覆盖了大多数解释情况。该语料库在arg-microtext语料库的基础上增加了深层的结构标注,用于标注论证关系,并实现了良好的标注者一致性。构建过程中使用了brat工具,并遵循brat standoff格式进行注释,同时包含了用于在brat中查看的配置文件。
使用方法
使用ARP语料库时,研究者可以参考包含的brat配置文件在brat环境中进行数据浏览和标注。开发集和测试集中的注释数据可用于模板创建和评估,用户需遵循相关文献中提及的标注方案以进行正确引用。
背景与挑战
背景概述
ARP Corpus数据集,由Paul Reisert等研究人员于2018年构建,旨在为论证推理模式提供预定义模式列表,以涵盖大部分解释性论证关系。该数据集在arg-microtext corpus的基础上,增加了深层次结构标注,用以标注论证关系,并获得了较高的标注者一致性。ARP Corpus的创建对于论证挖掘领域具有重要的影响力,推动了政策论证推理研究的发展。
当前挑战
ARP Corpus数据集在构建过程中,面临了如何有效标注论证关系的挑战。此外,数据集在解决论证关系领域问题时,需克服如何提高模板可行性评价的难题。该数据集的构建和使用,对标注工具的选择与配置,以及如何确保标注质量,都是相关研究的挑战所在。
常用场景
经典使用场景
在论证关系研究的领域中,ARP Corpus数据集以其深度结构标注而显得尤为重要。该数据集常用于构建与评估论证模板,通过69个标注的arg-microtext文本,研究人员能够对预设的论证关系模式进行实验验证。
解决学术问题
ARP Corpus数据集解决了论证分析中标注一致性不高的问题,其深度结构标注使得对论证关系的理解更为精确,为学术研究提供了可靠的数据基础,进而促进了论证挖掘领域的理论发展。
实际应用
实际应用中,ARP Corpus数据集可用于政策论证的自动识别与分析,有助于政策制定者理解公众意见,同时也为自然语言处理领域的自动化论证分析工具提供了标准化的数据支持。
数据集最近研究
最新研究方向
ARP Corpus数据集近期研究方向聚焦于论证关系解释模式的深度结构标注,该标注建立在arg-microtext语料库之上,旨在提升论证关系标注的一致性。该数据集的创建和应用,不仅推动了论证模板在政策论证推理中的可行标注方案研究,而且为论证挖掘领域提供了重要的资源。近期研究进一步探索了该数据集在模板可行性评估方面的应用,这对于理解论证的微观结构及其在文本中的呈现具有重要意义,进而有助于提升自然语言处理技术在论证分析方面的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作