mteb/neuclir-2023

Name: mteb/neuclir-2023
Creator: mteb
Published: 2025-05-03 20:39:12
License: 暂无描述

Hugging Face2025-05-03 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/mteb/neuclir-2023

下载链接

链接失效反馈

官方服务：

资源简介：

NeuCLIR2023Retrieval是一个大规模文本嵌入基准（MTEB）数据集，用于检索与查询相关的文档。该数据集包含多种语言，包括波斯语（fas）、俄语（rus）和中文（zho）。它被设计用于文本检索任务，并提供了大量的样本和文档，用于评估嵌入模型在检索任务上的表现。

NeuCLIR2023Retrieval is a Massive Text Embedding Benchmark (MTEB) dataset designed for text retrieval tasks. It includes multiple languages such as Persian (fas), Russian (rus), and Chinese (zho). The dataset is extensive with a large number of samples and documents, which are used to evaluate the performance of embedding models on retrieval tasks.

提供机构：

mteb

原始信息汇总

数据集概述

语言

波斯语 (fas)
俄语 (rus)
中文 (zho)

多语言性

多语言

任务类别

文本检索

来源

来自 NeuCLIR TREC Track 2023
生成自 https://huggingface.co/datasets/neuclir/neuclir1

5,000+

优质数据集

54 个

任务类型

进入经典数据集