irds/trec-mandarin_trec6
收藏数据集卡片 trec-mandarin/trec6
数据集概述
trec-mandarin/trec6 数据集由 ir-datasets 包提供。
数据内容
- 查询(queries):包含 26 个查询主题。
- 相关性评估(qrels):包含 9,236 条相关性评估记录。
- 文档(docs):使用
irds/trec-mandarin数据集。
使用方法
以下是加载和使用该数据集的示例代码:
python from datasets import load_dataset
queries = load_dataset(irds/trec-mandarin_trec6, queries) for record in queries: record # {query_id: ..., title_en: ..., title_zh: ..., description_en: ..., description_zh: ..., narrative_en: ..., narrative_zh: ...}
qrels = load_dataset(irds/trec-mandarin_trec6, qrels) for record in qrels: record # {query_id: ..., doc_id: ..., relevance: ..., iteration: ...}
引用信息
@inproceedings{Wilkinson1998Chinese, title={Chinese Document Retrieval at TREC-6}, author={Ross Wilkinson}, booktitle={TREC}, year={1997} } @misc{Rogers2000Mandarin, title={TREC Mandarin LDC2000T52}, author={Rogers, Willie}, year={2000}, url={https://catalog.ldc.upenn.edu/LDC2000T52}, publisher={Linguistic Data Consortium} }



