zjunlp/KGEditor
收藏数据集概述
数据集名称
- 名称: KGEditor
数据集描述
- 目的: 该数据集旨在修改知识图谱嵌入(KGE)模型中的错误知识,并向模型中注入新知识。为此,设计了两个子任务:EDIT和ADD。
- 子任务:
- EDIT: 编辑存储在知识图谱嵌入中的错误事实知识。
- ADD: 向模型中添加全新知识,无需重新训练整个模型。
数据集构建
- 基准数据集: FB15k-237 和 WN18RR
- 数据处理:
- EDIT任务: 从FB15k-237和WN18RR中采样困难三元组作为候选。
- ADD任务: 使用FB15k-237和WN18RR的原始训练集构建预训练数据集,并使用标准归纳设置中的数据。
数据集结构
-
数据实例:
-
EDIT示例:
{ "ori": ["Jennifer Connelly", "type of union", "Marriage"], "cor": ["Stephen Sondheim", "type of union", "Marriage"], "process": ["[MASK]", "type of union", "Marriage"], "label": "Jennifer Connelly" }
-
ADD示例:
{ "triples": ["Darryl F. Zanuck", "place of death", "Palm Springs"], "label": "Palm Springs", "head": 0 }
-
-
数据字段:
- EDIT任务:
- ori: 预训练数据集中的事实。
- cor: 损坏的三元组。
- process: 替换错误实体后的三元组。
- label: 分类标签,范围为所有实体。
- ADD任务:
- triples: 需要注入模型的新知识。
- label: 分类标签,范围为所有实体。
- head: 未出现在预训练中的头或尾实体。
- EDIT任务:
数据集大小
- 规模: 1K<n<10K
引用信息
@article{DBLP:journals/corr/abs-2301-10405, author = {Siyuan Cheng and Ningyu Zhang and Bozhong Tian and Zelin Dai and Feiyu Xiong and Wei Guo and Huajun Chen}, title = {Editing Language Model-based Knowledge Graph Embeddings}, journal = {CoRR}, volume = {abs/2301.10405}, year = {2023}, url = {https://doi.org/10.48550/arXiv.2301.10405}, doi = {10.48550/arXiv.2301.10405}, eprinttype = {arXiv}, eprint = {2301.10405}, timestamp = {Thu, 26 Jan 2023 17:49:16 +0100}, biburl = {https://dblp.org/rec/journals/corr/abs-2301-10405.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }



