iohadrubin/triviaqa_bm25_top100_kilt

Name: iohadrubin/triviaqa_bm25_top100_kilt
Creator: iohadrubin
Published: 2024-06-26 06:16:35
License: 暂无描述

Hugging Face2024-06-26 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/iohadrubin/triviaqa_bm25_top100_kilt

下载链接

链接失效反馈

官方服务：

资源简介：

数据集triviaqa_bm25_top100_kilt包含三个分割：开发集（dev）、无答案测试集（test_without_answers）和训练集（train）。每个分割包含2000个示例，总数据集大小为335423442字节。数据集的特征包括问题（question）、问题ID（qid）、输出（output）和上下文（ctxs），其中上下文是一个列表，包含内容（contents）和ID（id）两个字段。

The dataset triviaqa_bm25_top100_kilt contains three splits: dev, test_without_answers, and train. Each split contains 2000 examples, with a total dataset size of 335423442 bytes. The features of the dataset include question, qid (question ID), output, and ctxs (contexts), where ctxs is a list containing contents and id fields.

提供机构：

iohadrubin

原始信息汇总

数据集概述

数据集名称

triviaqa_bm25_top100_kilt

数据集配置

配置名称: default

数据文件

分割: dev
- 路径: data/dev-*
分割: test_without_answers
- 路径: data/test_without_answers-*
分割: train
- 路径: data/train-*

数据集特征

特征名称: question
- 数据类型: string
特征名称: qid
- 数据类型: string
特征名称: output
- 数据类型: string
特征名称: ctxs
- 列表:
  - 特征名称: contents
    - 数据类型: string
  - 特征名称: id
    - 数据类型: string

数据集分割

分割名称: dev
- 字节数: 113196706
- 样本数: 2000
分割名称: test_without_answers
- 字节数: 110010426
- 样本数: 2000
分割名称: train
- 字节数: 112216310
- 样本数: 2000

数据集大小

下载大小: 197593914 字节
数据集大小: 335423442 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集