irds/neumarco_zh_train
收藏Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/neumarco_zh_train
下载链接
链接失效反馈官方服务:
资源简介:
`neumarco/zh/train`数据集由ir-datasets包提供,包含查询(topics)、相关性评估(qrels)和文档对(docpairs)三个部分。查询数量为808,731,相关性评估数量为532,761,文档对数量为269,919,004。文档部分需要使用`irds/neumarco_zh`数据集。该数据集用于`neumarco_zh_train_judged`。
提供机构:
irds
原始信息汇总
数据集概述
数据集名称
neumarco/zh/train
数据集来源
- 提供者:ir-datasets 包
- 原始数据集:
irds/neumarco_zh
数据集内容
queries:查询(即主题),数量为808,731qrels:相关性评估,数量为532,761docpairs:文档对,数量为269,919,004docs:文档数据,使用irds/neumarco_zh数据集
数据集用途
被用于:neumarco_zh_train_judged
数据集使用示例
python from datasets import load_dataset
queries = load_dataset(irds/neumarco_zh_train, queries) for record in queries: record # {query_id: ..., text: ...}
qrels = load_dataset(irds/neumarco_zh_train, qrels) for record in qrels: record # {query_id: ..., doc_id: ..., relevance: ..., iteration: ...}
docpairs = load_dataset(irds/neumarco_zh_train, docpairs) for record in docpairs: record # {query_id: ..., doc_id_a: ..., doc_id_b: ...}



