golaxy/KnowCoder-Schema-Library
收藏Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/golaxy/KnowCoder-Schema-Library
下载链接
链接失效反馈官方服务:
资源简介:
KnowCoder Schema是一个基于Wikidata构建的代码风格schema库,用于表示实体、关系和事件等概念。该schema库包含超过29,177种实体类型、876种关系类型和519种事件类型。每个概念通过对应的类进行表示,并且包含类名、类继承、类注释、类型提示和类方法等信息。schema库的构建过程包括从Wikidata中选择概念、提取子类关系、生成概念描述等步骤。
KnowCoder Schema是一个基于Wikidata构建的代码风格schema库,用于表示实体、关系和事件等概念。该schema库包含超过29,177种实体类型、876种关系类型和519种事件类型。每个概念通过对应的类进行表示,并且包含类名、类继承、类注释、类型提示和类方法等信息。schema库的构建过程包括从Wikidata中选择概念、提取子类关系、生成概念描述等步骤。
提供机构:
golaxy
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- split: schema_library_ner
- path: schema_pys/Entities.py
- split: schema_library_re
- path: schema_pys/Relations.py
- split: schema_library_ee
- path: schema_pys/Events.py
- split: schema_library_ner
许可证
- 类型: apache-2.0
语言
- 支持的语言: en
标签
- 标签: schema
大小分类
- 范围: 1K<n<10K
数据集内容
- 数据集构建: 基于Wikidata,使用20220704的Wikidata dump。
- 概念选择: 从现有IE数据集中选择概念,包括KELM, UniversalNER, InstructIE, 和 LSEE。
- 概念约束: 根据概念的共现性推导约束。
- 分类构建: 从Wikidata提取“子类”关系构建分类。
- 概念描述: 使用Wikidata定义或GPT-4生成描述。
- 统计信息: 包含29,177实体类型,876关系类型,519事件类型。
数据集结构
- 基本类: 实体(Entity), 关系(Relation), 事件(Event)。
- 结构组成: 类名, 类继承, 类注释, 类型提示, 类方法。



