mteb/Touche2020-PL
收藏Hugging Face2025-05-04 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/mteb/Touche2020-PL
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了三个部分:文本语料库(corpus)、查询与语料对应关系(default)和查询信息(queries)。文本语料库部分包含了带有唯一标识符和文本内容的大量文本数据。查询与语料对应关系部分包含了查询的标识符、语料库的标识符和分数信息,可能用于信息检索任务。查询信息部分则包含了查询的标识符和文本内容。每个部分都提供了测试集。
The dataset consists of three parts: a text corpus (corpus), query-corpus correspondence (default), and query information (queries). The text corpus part contains a large number of text data with unique identifiers and text content. The query-corpus correspondence part includes query identifiers, corpus identifiers, and score information, which may be used for information retrieval tasks. The query information part contains the query identifiers and text content. Each part provides a test set.
提供机构:
mteb



