KMIR
收藏arXiv2022-02-28 更新2024-07-18 收录
下载链接:
https://github.com/kmirdataset/KMIR
下载链接
链接失效反馈官方服务:
资源简介:
KMIR数据集由华为泊松实验室创建,旨在评估语言模型在知识记忆、识别和推理方面的能力。该数据集包含184,348个精心设计的问题,覆盖通用知识、特定领域知识和常识三大类。数据集通过从WikiData和ConceptNet等公开知识源收集的192,078个知识三元组生成。KMIR数据集的应用领域广泛,主要用于解决语言模型作为知识源的可靠性和有效性问题,推动语言模型在知识相关任务中的设计和优化。
提供机构:
华为泊松实验室
创建时间:
2022-02-28
原始信息汇总
KMIR: 语言模型知识记忆、识别和推理能力评估基准
数据集文件
kmir_train_cloze.jsonlkmir_dev_cloze.jsonlkmir_test_cloze.jsonl
搜集汇总
背景与挑战
背景概述
KMIR是一个用于评估语言模型知识记忆、识别和推理能力的基准数据集。数据集以压缩文件(kmir.zip)形式提供,包含训练、开发和测试三个JSONL格式文件,专门设计用于语言模型性能的全面评估。
以上内容由遇见数据集搜集并总结生成



