kelm
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/kelm
下载链接
链接失效反馈官方服务:
资源简介:
Corpus for Knowledge-Enhanced Language Model Pre-training (KELM) 专注于将知识图谱三元组(主语、关系、宾语)转换为自然语言句子,用于数据到文本的生成任务。该语料库包含约1800万个句子,涵盖约4500万个三元组和约1500个不同的关系,数据来源于英文维基百科及其相关的知识图谱。数据集包括训练集、验证集和测试集,并采用CC BY-SA 2.0许可协议。其中,每个数据实例由一个知识图谱三元组及其对应的自然语言组成。
创建时间:
2024-07-19



