five

DWIE

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/klimzaporojets/dwie
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个多任务文档级信息抽取数据集,它包含了从德国之声收集的新闻文章。此外,该数据集还被用于评估PRiSM在不同语境下的有效性。其主要任务是进行文档级的信息抽取。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DWIE是一个文档级多任务信息提取数据集,以实体为中心,整合了命名实体识别、共指消解、关系提取和实体链接四个子任务。数据来源于德国之声的英文新闻内容,采用随机抽样和自定义标注方案,以覆盖真实场景,支持多任务研究。数据集格式为JSON,包含详细的实体和关系标注,适用于文档级信息提取模型的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作