iohadrubin/nq_bm25_top100_kilt
收藏Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/iohadrubin/nq_bm25_top100_kilt
下载链接
链接失效反馈官方服务:
资源简介:
数据集nq_bm25_top100_kilt包含三个分割:开发集(dev)、无答案测试集(test_without_answers)和训练集(train)。每个分割的数据文件路径已指定。数据集的特征包括问题(question)、问题ID(qid)、输出(output)和上下文列表(ctxs),其中上下文列表包含内容(contents)和ID(id)。开发集包含2000个示例,无答案测试集包含1444个示例,训练集包含2000个示例。整个数据集的下载大小为178305188字节,总大小为306142200字节。
The dataset nq_bm25_top100_kilt includes three splits: dev, test_without_answers, and train. The data file paths for each split are specified. The features of the dataset include question, qid (question ID), output, and ctxs (context list), where the context list contains contents and id. The dev split contains 2000 examples, the test_without_answers split contains 1444 examples, and the train split contains 2000 examples. The download size of the entire dataset is 178305188 bytes, and the total size is 306142200 bytes.
提供机构:
iohadrubin
原始信息汇总
数据集概述
数据集名称
nq_bm25_top100_kilt
数据集配置
- 默认配置:default
数据文件
- 开发集(dev):路径为
data/dev-*,包含2000个样本,大小为115784683字节。 - 无答案测试集(test_without_answers):路径为
data/test_without_answers-*,包含1444个样本,大小为79815477字节。 - 训练集(train):路径为
data/train-*,包含2000个样本,大小为110542040字节。
数据集特征
- 问题(question):字符串类型
- 问题ID(qid):字符串类型
- 输出(output):字符串类型
- 上下文(ctxs):列表类型
- 内容(contents):字符串类型
- ID(id):字符串类型
数据集大小
- 下载大小:178305188字节
- 数据集总大小:306142200字节



