MUC-4
收藏arXiv2025-09-30 收录
下载链接:
https://www-nlpir.nist.gov/related_projects/muc/muc_data/muc_data_index.html
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为MUC-4,主要用于评估信息提取中的模板填充任务,特别关注事件个体化问题,即多个标准模板可能指向语义上相似的事件。此外,该数据集还展示了在事件提取任务中,基于对齐的评分指标所面临的挑战,尤其是在事件个体化的情况下,可能会导致评价分数出现显著差异。该数据集所涉及的任务是文档级别的信息提取。
The dataset is named MUC-4, which is primarily used to evaluate template filling tasks in information extraction, with a particular focus on the problem of event individuation—i.e., scenarios where multiple standard templates may correspond to semantically similar events. Additionally, this dataset demonstrates the challenges faced by alignment-based scoring metrics in event extraction tasks, especially that significant discrepancies in evaluation scores may arise when handling event individuation. The tasks involved in this dataset are document-level information extraction.
搜集汇总
数据集介绍

背景与挑战
背景概述
MUC-4数据集是MUC(消息理解会议)系列的一部分,由FBIS免费提供,用于消息理解评估,包括训练和测试的标注新闻文章数据。它主要用于事件提取和实体识别等自然语言处理任务,但具体任务细节和数据规模未在提供内容中详述。
以上内容由遇见数据集搜集并总结生成



