irds/mmarco_pt_train_v1.1
收藏Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/mmarco_pt_train_v1.1
下载链接
链接失效反馈官方服务:
资源简介:
`mmarco/pt/train/v1.1`数据集是由ir-datasets包提供的一个多语言版本的MS MARCO段落排名数据集。该数据集主要用于文本检索任务,包含808,731个查询(即主题)。数据集的使用需要通过`irds/mmarco_pt`和`irds/mmarco_pt_train`来获取文档和查询相关度标签。
The `mmarco/pt/train/v1.1` dataset is a multilingual version of the MS MARCO passage ranking dataset provided by the ir-datasets library. This dataset is primarily used for text retrieval tasks and contains 808,731 queries (i.e., topics). To use this dataset, users must obtain documents and query relevance labels via `irds/mmarco_pt` and `irds/mmarco_pt_train`.
提供机构:
irds
原始信息汇总
数据集概述
数据集名称
mmarco/pt/train/v1.1
数据集来源
数据集内容
- queries: 查询(即主题),数量为808,731个。
- docs: 使用数据集
irds/mmarco_pt。 - qrels 和 docpairs: 使用数据集
irds/mmarco_pt_train。
数据集用途
用于文本检索任务。
引用信息
@article{Bonifacio2021MMarco, title={{mMARCO}: A Multilingual Version of {MS MARCO} Passage Ranking Dataset}, author={Luiz Henrique Bonifacio and Israel Campiotti and Roberto Lotufo and Rodrigo Nogueira}, year={2021}, journal={arXiv:2108.13897} }



