zeta-alpha-ai/NanoNQ
收藏Hugging Face2024-09-10 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/zeta-alpha-ai/NanoNQ
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
source_datasets:
- NQ
task_categories:
- text-retrieval
task_ids:
- document-retrieval
tags:
- text-retrieval
dataset_info:
- config_name: corpus
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 2740852
num_examples: 5035
download_size: 1776094
dataset_size: 2740852
- config_name: qrels
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
splits:
- name: train
num_bytes: 1340
num_examples: 57
download_size: 2020
dataset_size: 1340
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 3132
num_examples: 50
download_size: 3658
dataset_size: 3132
configs:
- config_name: corpus
data_files:
- split: train
path: corpus/train-*
- config_name: qrels
data_files:
- split: train
path: qrels/train-*
- config_name: queries
data_files:
- split: train
path: queries/train-*
---
语言:
- 英语
许可协议:知识共享署名4.0协议(CC BY 4.0)
多语言属性:
- 单语(monolingual)
源数据集:
- NQ
任务类别:
- 文本检索(text-retrieval)
任务子类型:
- 文档检索(document-retrieval)
标签:
- 文本检索(text-retrieval)
数据集信息:
- 配置名称:语料库(corpus)
特征:
- 名称:_id,数据类型:字符串
- 名称:text,数据类型:字符串
拆分集:
- 名称:训练集(train),字节数:2740852,示例数量:5035
下载大小:1776094,数据集总大小:2740852
- 配置名称:查询相关性标注集(qrels)
特征:
- 名称:查询ID(query-id),数据类型:字符串
- 名称:语料库ID(corpus-id),数据类型:字符串
拆分集:
- 名称:训练集(train),字节数:1340,示例数量:57
下载大小:2020,数据集总大小:1340
- 配置名称:查询集(queries)
特征:
- 名称:_id,数据类型:字符串
- 名称:text,数据类型:字符串
拆分集:
- 名称:训练集(train),字节数:3132,示例数量:50
下载大小:3658,数据集总大小:3132
配置项:
- 配置名称:语料库(corpus)
数据文件:
- 拆分集:训练集(train),路径:corpus/train-*
- 配置名称:查询相关性标注集(qrels)
数据文件:
- 拆分集:训练集(train),路径:qrels/train-*
- 配置名称:查询集(queries)
数据文件:
- 拆分集:训练集(train),路径:queries/train-*
提供机构:
zeta-alpha-ai



