five

KMIR

收藏
arXiv2022-02-28 更新2024-07-18 收录
下载链接:
https://github.com/kmirdataset/KMIR
下载链接
链接失效反馈
官方服务:
资源简介:
KMIR数据集由华为泊松实验室创建,旨在评估语言模型在知识记忆、识别和推理方面的能力。该数据集包含184,348个精心设计的问题,覆盖通用知识、特定领域知识和常识三大类。数据集通过从WikiData和ConceptNet等公开知识源收集的192,078个知识三元组生成。KMIR数据集的应用领域广泛,主要用于解决语言模型作为知识源的可靠性和有效性问题,推动语言模型在知识相关任务中的设计和优化。
提供机构:
华为泊松实验室
创建时间:
2022-02-28
原始信息汇总

KMIR: 语言模型知识记忆、识别和推理能力评估基准

数据集文件

  • kmir_train_cloze.jsonl
  • kmir_dev_cloze.jsonl
  • kmir_test_cloze.jsonl
搜集汇总
背景与挑战
背景概述
KMIR是一个用于评估语言模型知识记忆、识别和推理能力的基准数据集。数据集以压缩文件(kmir.zip)形式提供,包含训练、开发和测试三个JSONL格式文件,专门设计用于语言模型性能的全面评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作