GraphTwin-ai/DBpedia-2020-PG-Edges
收藏Hugging Face2025-02-12 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/GraphTwin-ai/DBpedia-2020-PG-Edges
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含四个字段(start、end、type、properties)的训练集,其中start和end字段是整型,用于标记文本中的某个区间的起始和结束位置;type字段是字符串类型,可能用于表示区间的类型或类别;properties字段也是字符串类型,可能包含关于区间的其他属性信息。训练集包含了超过2100万个示例,数据集总大小为约1.3GB。
The dataset is a training set containing four fields (start, end, type, properties), with start and end as integer types for marking the start and end positions of a text interval; the type field is a string type, possibly representing the type or category of the interval; and the properties field is also a string type, which may contain other property information about the interval. The training set includes over 21 million examples, with the total size of the dataset being approximately 1.3GB.
提供机构:
GraphTwin-ai
搜集汇总
背景与挑战
背景概述
该数据集是一个大规模的关系图边训练集,基于DBpedia-2020知识库构建,包含超过2100万个示例,总大小约1.3GB。数据集由四个字段组成:start和end为整型,标记文本区间位置;type和properties为字符串类型,分别表示区间类别和属性信息,适用于图结构学习和自然语言处理应用。
以上内容由遇见数据集搜集并总结生成



