five

zjunlp/KGEditor

收藏
Hugging Face2023-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zjunlp/KGEditor
下载链接
链接失效反馈
官方服务:
资源简介:
KGEditor数据集旨在修改和添加知识图谱嵌入模型中的知识,设计了两个子任务:EDIT和ADD。EDIT子任务用于修改存储在知识图谱嵌入中的错误事实知识,而ADD子任务则用于向模型中添加全新知识,而无需重新训练整个模型。该数据集基于FB15k-237和WN18RR两个基准数据集构建,包含了数据实例、字段描述和数据分割的详细信息。
提供机构:
zjunlp
原始信息汇总

数据集概述

数据集名称

  • 名称: KGEditor

数据集描述

  • 目的: 该数据集旨在修改知识图谱嵌入(KGE)模型中的错误知识,并向模型中注入新知识。为此,设计了两个子任务:EDIT和ADD。
  • 子任务:
    • EDIT: 编辑存储在知识图谱嵌入中的错误事实知识。
    • ADD: 向模型中添加全新知识,无需重新训练整个模型。

数据集构建

  • 基准数据集: FB15k-237 和 WN18RR
  • 数据处理:
    • EDIT任务: 从FB15k-237和WN18RR中采样困难三元组作为候选。
    • ADD任务: 使用FB15k-237和WN18RR的原始训练集构建预训练数据集,并使用标准归纳设置中的数据。

数据集结构

  • 数据实例:

    • EDIT示例:

      { "ori": ["Jennifer Connelly", "type of union", "Marriage"], "cor": ["Stephen Sondheim", "type of union", "Marriage"], "process": ["[MASK]", "type of union", "Marriage"], "label": "Jennifer Connelly" }

    • ADD示例:

      { "triples": ["Darryl F. Zanuck", "place of death", "Palm Springs"], "label": "Palm Springs", "head": 0 }

  • 数据字段:

    • EDIT任务:
      • ori: 预训练数据集中的事实。
      • cor: 损坏的三元组。
      • process: 替换错误实体后的三元组。
      • label: 分类标签,范围为所有实体。
    • ADD任务:
      • triples: 需要注入模型的新知识。
      • label: 分类标签,范围为所有实体。
      • head: 未出现在预训练中的头或尾实体。

数据集大小

  • 规模: 1K<n<10K

引用信息

@article{DBLP:journals/corr/abs-2301-10405, author = {Siyuan Cheng and Ningyu Zhang and Bozhong Tian and Zelin Dai and Feiyu Xiong and Wei Guo and Huajun Chen}, title = {Editing Language Model-based Knowledge Graph Embeddings}, journal = {CoRR}, volume = {abs/2301.10405}, year = {2023}, url = {https://doi.org/10.48550/arXiv.2301.10405}, doi = {10.48550/arXiv.2301.10405}, eprinttype = {arXiv}, eprint = {2301.10405}, timestamp = {Thu, 26 Jan 2023 17:49:16 +0100}, biburl = {https://dblp.org/rec/journals/corr/abs-2301-10405.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作