DBP15K
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/nju-websoft/jape
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为DBP15K,是从DBpedia中提取的实体对齐数据集,包含三种语言设置:中文-英文(ZH-EN)、日语-英文(JA-EN)和法语-英文(FR-EN)。每个设置中都包含了一万五千对实体对齐数据。此外,该数据集的划分与之前研究保持一致,其中30%的实体对齐数据用于训练。规模方面,三种设置各有15,000对数据。该数据集的任务是实体对齐。
This dataset, named DBP15K, is an entity alignment dataset extracted from DBpedia. It comprises three language pair configurations: Chinese-English (ZH-EN), Japanese-English (JA-EN), and French-English (FR-EN). Each configuration contains 15,000 entity alignment pairs. The data partitioning follows the protocol used in prior research, with 30% of the entity alignment pairs allocated for training. All three configurations have 15,000 pairs respectively. The task of this dataset is entity alignment.
提供机构:
DBpedia
搜集汇总
数据集介绍

背景与挑战
背景概述
DBP15K是一个跨语言实体对齐数据集,支持联合属性保留嵌入方法,包含中英文知识图谱的实体、关系和属性三元组。数据集提供不同比例的实体链接作为训练数据,适用于嵌入模型的训练和测试。
以上内容由遇见数据集搜集并总结生成



