MAVEN-ARG

Name: MAVEN-ARG
Creator: 清华大学计算机科学与技术系
Published: 2023-11-16 00:52:14
License: 暂无描述

arXiv2023-11-16 更新2024-06-21 收录

下载链接：

https://github.com/THU-KEG/MAVEN-Argument

下载链接

链接失效反馈

官方服务：

资源简介：

MAVEN-ARG是由清华大学计算机科学与技术系创建的综合性事件理解数据集，旨在支持事件检测、事件论元提取和事件关系提取。该数据集具有三大优势：一是拥有涵盖162种事件类型和612个论元角色的全面模式，所有这些都有专家编写的定义和示例；二是数据规模庞大，包含98,591个事件和290,613个论元，均通过人工标注获得；三是支持所有事件论元提取任务变体，既标注实体论元，也标注非实体论元。MAVEN-ARG不仅完成了综合性事件理解数据集的构建，还通过初步探索未来事件预测等应用，展示了其在推动复杂事件基础应用方面的潜力。

MAVEN-ARG is a comprehensive event understanding dataset developed by the Department of Computer Science and Technology, Tsinghua University, aiming to support event detection, event argument extraction and event relation extraction. This dataset boasts three major advantages: First, it features a comprehensive schema covering 162 event types and 612 argument roles, all of which are equipped with expert-curated definitions and examples; Second, it has a large-scale dataset with 98,591 events and 290,613 arguments, all manually annotated; Third, it supports all variants of event argument extraction tasks, annotating both entity arguments and non-entity arguments. Beyond the construction of this comprehensive event understanding dataset, MAVEN-ARG has also demonstrated its potential in promoting basic applications of complex events by preliminarily exploring applications such as future event prediction.

提供机构：

清华大学计算机科学与技术系

创建时间：

2023-11-16

搜集汇总

数据集介绍

构建方式

在事件理解研究领域，构建一个覆盖完整流程的大规模数据集长期面临挑战。MAVEN-ARG的构建以MAVEN数据集为基础，通过系统化的人工标注流程扩展了事件论元信息。其构建始于事件模式设计，由专家耗时三年为162个事件类型手工设计了612个论元角色，每个角色均配有详尽的文本定义和示例。随后进行实体标注，遵循Few-NERD的规范标注了七种粗粒度实体类型及实体共指关系，并通过多数投票和资深标注员核查确保质量。最后进行事件论元标注，基于MAVEN的事件检测标注和MAVEN-ERE的事件共指关系，采用三级标注流程：普通标注员初标、资深标注员修正、专家核查，最终通过Fleiss' kappa系数验证了标注一致性。

特点

MAVEN-ARG作为事件论元抽取数据集展现出三个核心特征。其事件模式具有高度全面性，涵盖162个事件类型和612个论元角色，所有定义均由专家撰写，形成了覆盖通用领域事件的完整语义框架。数据规模显著超越现有数据集，包含98,591个事件和290,613个论元，均为人工标注结果，为长尾事件类型提供了充足的训练和评估样本。标注方式体现彻底性，支持事件论元抽取的所有任务变体：在文档级别为所有细粒度事件标注实体与非实体论元，同时完整标注实体共指和事件共指关系，这种设计使其能够评估各类EAE方法的综合性能。

使用方法

该数据集为事件理解研究提供了多层次的评估框架。在实验设置上，研究者可采用管道评估策略，基于预测或给定的触发器进行事件论元抽取。评估指标需适应非实体论元的特性，MAVEN-ARG将每个论元角色视为对文档的多答案问答任务，采用词袋F1和精确匹配指标，并扩展至考虑实体共指和事件共指的多答案评估。数据集支持三类评估级别：提及级别评估每个论元提及的准确性；实体共指级别要求正确预测实体论元的任一提及；事件共指级别则允许在共指事件触发器中正确预测任一事件的论元。这种分层评估机制能够全面衡量模型在不同应用场景下的实际性能。

背景与挑战

背景概述

事件理解作为自然语言处理的核心任务，其发展长期受限于缺乏覆盖全流程的大规模标注数据集。为填补这一空白，清华大学、中国人民大学与腾讯微信人工智能团队于2023年联合发布了MAVEN-ARG数据集。该研究旨在构建首个支持事件检测、事件论元抽取及事件关系抽取的一体化基准，通过为原有MAVEN数据集增补精细的事件论元标注，系统性地解决了事件结构解析的完整性问题。该数据集包含162种事件类型与612种论元角色，凭借其专家撰写的定义、大规模人工标注及文档级全覆盖特性，显著推动了通用领域事件理解研究的发展，并为基于事件的复杂下游应用奠定了关键数据基础。

当前挑战

MAVEN-ARG所应对的核心领域挑战在于全面解决事件论元抽取任务的复杂性，其需在文档层面同时处理实体与非实体论元，并覆盖长尾分布的大量论元角色。在构建过程中，研究团队面临多重困难：一是事件模式设计极具挑战，需耗时三年由专家手动为162种事件类型设计612种具有清晰语义定义的论元角色，并确保其与FrameNet等语言学资源的协调；二是标注规模与质量控制的平衡，该数据集包含超过29万个论元标注，需通过多阶段标注流程与严格的一致性校验（Fleiss‘ kappa达68.6%）来保证数据可靠性；三是标注复杂性高，需在文档范围内处理事件与实体的共指关系，并支持长距离的触发词-论元关联建模，这对标注者的认知负荷与标注系统的设计均提出了严峻考验。

常用场景

经典使用场景

在自然语言理解领域，事件理解是解析文本中动态信息的关键环节。MAVEN-ARG数据集作为首个覆盖事件检测、事件论元抽取及事件关系抽取全流程的一体化资源，其经典使用场景在于为复杂事件结构解析提供基准测试平台。该数据集凭借其涵盖162种事件类型与612种论元角色的详尽模式，以及包含近十万事件与数十万论元的大规模人工标注，为研究者评估模型在文档级、细粒度事件论元抽取任务上的性能提供了标准化环境。其设计充分考虑了事件论元在文档中的长距离依赖特性，能够有效检验模型对跨句论元关联的捕捉能力。

解决学术问题

长期以来，事件理解研究因任务复杂性导致标注困难，缺乏覆盖全流程的大规模数据集。MAVEN-ARG通过融合事件检测、论元抽取与关系抽取的完整标注体系，系统性地解决了三大核心学术问题：其一，突破了传统数据集仅关注单一任务或有限事件类型的局限，为端到端事件理解方法的发展提供了统一数据基础；其二，通过同时标注实体与非实体论元，并支持文档级细粒度事件分析，克服了以往数据集中论元类型受限、标注范围狭窄的缺陷；其三，其大规模、长尾分布的标注特性为研究模型在复杂真实场景下的泛化能力与鲁棒性提供了关键实验依据，推动了事件论元抽取技术向实用化迈进。

衍生相关工作

围绕MAVEN-ARG所构建的完整事件理解体系，已催生了一系列经典研究工作。其前身MAVEN数据集聚焦事件检测，而MAVEN-ERE则专门标注事件关系，三者共同形成了事件理解的三位一体资源生态。在方法论上，该数据集推动了基于动态多池化机制的分类模型、序列标注模型以及问题回答范式的论元抽取技术发展。同时，其挑战性结果激发了生成式模型在复杂结构化输出上的探索，如将事件抽取转化为序列到结构的生成任务。数据集对大规模语言模型的评测也促进了提示工程与上下文学习在事件理解中的适配研究，为结合预训练知识解决长尾论元识别问题开辟了新路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集