iohadrubin/wned_bm25_top100_kilt
收藏Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/iohadrubin/wned_bm25_top100_kilt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为wned_bm25_top100_kilt,包含两个分割:dev和test_without_answers。每个分割包含2000个示例,数据集总大小为232851784字节。数据集的特征包括question(问题)、qid(问题ID)、output(输出)和ctxs(上下文),其中ctxs是一个列表,包含contents(内容)和id(ID)两个字段。
The dataset is named wned_bm25_top100_kilt and contains two splits: dev and test_without_answers. Each split contains 2000 examples, and the total dataset size is 232851784 bytes. The features of the dataset include question, qid, output, and ctxs, where ctxs is a list containing contents and id.
提供机构:
iohadrubin
原始信息汇总
数据集概述
数据集名称
wned_bm25_top100_kilt
数据集配置
- 配置名称: default
数据文件
- 拆分: dev
- 路径: data/dev-*
- 拆分: test_without_answers
- 路径: data/test_without_answers-*
数据集特征
- 特征名称: question
- 数据类型: string
- 特征名称: qid
- 数据类型: string
- 特征名称: output
- 数据类型: string
- 特征名称: ctxs
- 列表:
- 特征名称: contents
- 数据类型: string
- 特征名称: id
- 数据类型: string
- 特征名称: contents
- 列表:
数据集拆分
- 拆分名称: dev
- 字节数: 116253267
- 样本数: 2000
- 拆分名称: test_without_answers
- 字节数: 116598517
- 样本数: 2000
数据集大小
- 下载大小: 56295640
- 数据集大小: 232851784



