Mewsli-9
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/google-research/google-research/tree/master/dense_representations_for_entity_retrieval/mel#get-mewsli-9-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含与Wikidata关联实体提及的多语言数据集,它由来自Wikinews的9种语言的文档组成。这些语言包括阿拉伯语、英语、波斯语、德语、日语、塞尔维亚语、西班牙语、泰米尔语和土耳其语。大约有11%的目标实体没有对应的英文维基百科页面。该数据集涵盖了来自58,717篇新闻文章的289,087个实体提及,其任务是进行多语言实体链接。
提供机构:
Wikinews



