projetomemoreba/mteb_mrobust_retrieval
收藏Hugging Face2024-04-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/projetomemoreba/mteb_mrobust_retrieval
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: corpus
features:
- name: _id
dtype: string
- name: text
dtype: string
- name: title
dtype: string
splits:
- name: corpus
num_bytes: 635358131.9513439
num_examples: 174787
download_size: 456676642
dataset_size: 635358131.9513439
- config_name: default
features:
- name: query-id
dtype: string
- name: document-id
dtype: string
- name: score
dtype: int64
splits:
- name: test
num_bytes: 508017.7811277737
num_examples: 16381
download_size: 157808
dataset_size: 508017.7811277737
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: queries
num_bytes: 29918
num_examples: 250
download_size: 20621
dataset_size: 29918
configs:
- config_name: corpus
data_files:
- split: corpus
path: corpus/corpus-*
- config_name: default
data_files:
- split: test
path: data/test-*
- config_name: queries
data_files:
- split: queries
path: queries/queries-*
---
提供机构:
projetomemoreba
原始信息汇总
数据集概述
配置信息
配置1: corpus
- 特征:
_id: 数据类型为字符串text: 数据类型为字符串title: 数据类型为字符串
- 分割:
corpus: 大小为635358131.9513439字节,包含174787个样本
- 下载大小: 456676642字节
- 数据集大小: 635358131.9513439字节
配置2: default
- 特征:
query-id: 数据类型为字符串document-id: 数据类型为字符串score: 数据类型为int64
- 分割:
test: 大小为508017.7811277737字节,包含16381个样本
- 下载大小: 157808字节
- 数据集大小: 508017.7811277737字节
配置3: queries
- 特征:
_id: 数据类型为字符串text: 数据类型为字符串
- 分割:
queries: 大小为29918字节,包含250个样本
- 下载大小: 20621字节
- 数据集大小: 29918字节
数据文件路径
配置1: corpus
- 分割:
corpus - 路径:
corpus/corpus-*
配置2: default
- 分割:
test - 路径:
data/test-*
配置3: queries
- 分割:
queries - 路径:
queries/queries-*



