five

golaxy/KnowCoder-Schema-Library

收藏
Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/golaxy/KnowCoder-Schema-Library
下载链接
链接失效反馈
官方服务:
资源简介:
KnowCoder Schema是一个基于Wikidata构建的代码风格schema库,用于表示实体、关系和事件等概念。该schema库包含超过29,177种实体类型、876种关系类型和519种事件类型。每个概念通过对应的类进行表示,并且包含类名、类继承、类注释、类型提示和类方法等信息。schema库的构建过程包括从Wikidata中选择概念、提取子类关系、生成概念描述等步骤。

KnowCoder Schema是一个基于Wikidata构建的代码风格schema库,用于表示实体、关系和事件等概念。该schema库包含超过29,177种实体类型、876种关系类型和519种事件类型。每个概念通过对应的类进行表示,并且包含类名、类继承、类注释、类型提示和类方法等信息。schema库的构建过程包括从Wikidata中选择概念、提取子类关系、生成概念描述等步骤。
提供机构:
golaxy
原始信息汇总

数据集概述

数据集配置

  • 配置名称: default
  • 数据文件:
    • split: schema_library_ner
      • path: schema_pys/Entities.py
    • split: schema_library_re
      • path: schema_pys/Relations.py
    • split: schema_library_ee
      • path: schema_pys/Events.py

许可证

  • 类型: apache-2.0

语言

  • 支持的语言: en

标签

  • 标签: schema

大小分类

  • 范围: 1K<n<10K

数据集内容

  • 数据集构建: 基于Wikidata,使用20220704的Wikidata dump。
  • 概念选择: 从现有IE数据集中选择概念,包括KELM, UniversalNER, InstructIE, 和 LSEE。
  • 概念约束: 根据概念的共现性推导约束。
  • 分类构建: 从Wikidata提取“子类”关系构建分类。
  • 概念描述: 使用Wikidata定义或GPT-4生成描述。
  • 统计信息: 包含29,177实体类型,876关系类型,519事件类型。

数据集结构

  • 基本类: 实体(Entity), 关系(Relation), 事件(Event)。
  • 结构组成: 类名, 类继承, 类注释, 类型提示, 类方法。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作