mteb/nq_top_5_only_w_correct
收藏Hugging Face2024-06-08 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mteb/nq_top_5_only_w_correct
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: corpus
features:
- name: _id
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: corpus
num_bytes: 8751745.930454513
num_examples: 16988
download_size: 5278069
dataset_size: 8751745.930454513
- config_name: default
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: float64
splits:
- name: test
num_bytes: 133323.0
num_examples: 4201
download_size: 51011
dataset_size: 133323.0
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: queries
num_bytes: 220472
num_examples: 3452
download_size: 140468
dataset_size: 220472
configs:
- config_name: corpus
data_files:
- split: corpus
path: corpus/corpus-*
- config_name: default
data_files:
- split: test
path: data/test-*
- config_name: queries
data_files:
- split: queries
path: queries/queries-*
---
数据集信息:
- 配置名称:语料库(corpus)
特征:
- 字段名:_id
数据类型:字符串型(string)
- 字段名:标题
数据类型:字符串型(string)
- 字段名:文本
数据类型:字符串型(string)
数据集划分:
- 划分名称:语料库(corpus)
占用字节数:8751745.930454513
样本数量:16988
下载大小:5278069
数据集占用大小:8751745.930454513
- 配置名称:默认(default)
特征:
- 字段名:查询ID(query-id)
数据类型:字符串型(string)
- 字段名:语料库ID(corpus-id)
数据类型:字符串型(string)
- 字段名:得分
数据类型:64位浮点型(float64)
数据集划分:
- 划分名称:测试集
占用字节数:133323.0
样本数量:4201
下载大小:51011
数据集占用大小:133323.0
- 配置名称:查询集(queries)
特征:
- 字段名:_id
数据类型:字符串型(string)
- 字段名:文本
数据类型:字符串型(string)
数据集划分:
- 划分名称:查询集(queries)
占用字节数:220472
样本数量:3452
下载大小:140468
数据集占用大小:220472
数据集配置:
- 配置名称:语料库(corpus)
数据文件:
- 划分集:语料库(corpus)
文件路径:corpus/corpus-*
- 配置名称:默认(default)
数据文件:
- 划分集:测试集
文件路径:data/test-*
- 配置名称:查询集(queries)
数据文件:
- 划分集:查询集(queries)
文件路径:queries/queries-*
提供机构:
mteb



