KILT(KILT Benchmark)

Name: KILT(KILT Benchmark)
Creator: OpenDataLab
Published: 2026-05-17 09:30:26
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/KILT

下载链接

链接失效反馈

官方服务：

资源简介：

KILT (Knowledge Intensive Language Tasks) 是一个由 11 个数据集组成的基准，代表 5 种类型的任务：事实检查 (FEVER)、实体链接 (AIDA CoNLL-YAGO、WNED-WIKI、WNED-CWEB)、插槽填充 (T-Rex , Zero Shot RE), 开放域 QA (Natural Questions, HotpotQA, TriviaQA, ELI5), Dialog generation (Wizard of Wikipedia)。所有这些数据集都基于一个预处理的维基百科快照，允许更公平和更一致的评估，并支持新的任务设置，例如多任务和迁移学习。

KILT (Knowledge Intensive Language Tasks) is a benchmark composed of 11 datasets covering 5 types of tasks: Fact Checking (FEVER), Entity Linking (AIDA CoNLL-YAGO, WNED-WIKI, WNED-CWEB), Slot Filling (T-Rex, Zero-Shot RE), Open-Domain QA (Natural Questions, HotpotQA, TriviaQA, ELI5), and Dialogue Generation (Wizard of Wikipedia). All these datasets are built on a preprocessed Wikipedia snapshot, enabling fairer and more consistent evaluation, and supporting novel task settings such as multi-task learning and transfer learning.

提供机构：

OpenDataLab

创建时间：

2022-08-16

搜集汇总

数据集介绍