DWIE
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/klimzaporojets/dwie
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个多任务文档级信息抽取数据集,它包含了从德国之声收集的新闻文章。此外,该数据集还被用于评估PRiSM在不同语境下的有效性。其主要任务是进行文档级的信息抽取。
搜集汇总
数据集介绍

背景与挑战
背景概述
DWIE是一个文档级多任务信息提取数据集,以实体为中心,整合了命名实体识别、共指消解、关系提取和实体链接四个子任务。数据来源于德国之声的英文新闻内容,采用随机抽样和自定义标注方案,以覆盖真实场景,支持多任务研究。数据集格式为JSON,包含详细的实体和关系标注,适用于文档级信息提取模型的训练和评估。
以上内容由遇见数据集搜集并总结生成



