DBP15K
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/DBP15K
下载链接
链接失效反馈官方服务:
资源简介:
DBP15k 包含四个特定语言的 KG,分别从英语 (En)、汉语 (Zh)、法语 (Fr) 和日语 (Ja) DBpedia 中提取,每个都包含大约 65k-106k 个实体。构造三组 15k 对齐标签以对齐其他三种语言和 En 之间的实体。
DBP15k comprises four language-specific knowledge graphs (KGs) extracted from English (En), Chinese (Zh), French (Fr), and Japanese (Ja) DBpedia, respectively. Each graph contains approximately 65k to 106k entities. Three sets of 15k alignment labels are constructed to align entities between English and each of the other three languages.
提供机构:
OpenDataLab
创建时间:
2022-05-25
搜集汇总
数据集介绍

背景与挑战
背景概述
DBP15K是一个多语言知识图谱数据集,包含英语、汉语、法语和日语四个版本,每个版本有约65k-106k个实体,并提供了15k对齐标签用于跨语言实体对齐。该数据集由南京大学和德克萨斯大学阿灵顿分校于2017年发布,主要用于文本实体对齐、预训练和信息提取等自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



