five

MUC-4

收藏
arXiv2025-09-30 收录
下载链接:
https://www-nlpir.nist.gov/related_projects/muc/muc_data/muc_data_index.html
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为MUC-4,主要用于评估信息提取中的模板填充任务,特别关注事件个体化问题,即多个标准模板可能指向语义上相似的事件。此外,该数据集还展示了在事件提取任务中,基于对齐的评分指标所面临的挑战,尤其是在事件个体化的情况下,可能会导致评价分数出现显著差异。该数据集所涉及的任务是文档级别的信息提取。

The dataset is named MUC-4, which is primarily used to evaluate template filling tasks in information extraction, with a particular focus on the problem of event individuation—i.e., scenarios where multiple standard templates may correspond to semantically similar events. Additionally, this dataset demonstrates the challenges faced by alignment-based scoring metrics in event extraction tasks, especially that significant discrepancies in evaluation scores may arise when handling event individuation. The tasks involved in this dataset are document-level information extraction.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MUC-4数据集是MUC(消息理解会议)系列的一部分,由FBIS免费提供,用于消息理解评估,包括训练和测试的标注新闻文章数据。它主要用于事件提取和实体识别等自然语言处理任务,但具体任务细节和数据规模未在提供内容中详述。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作