macavaney/d2q-msmarco-passage
收藏Hugging Face2022-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/macavaney/d2q-msmarco-passage
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为`msmarco-passage`数据集提供了预先生成的查询,用于Doc2Query索引。这些查询是由T5 Doc2Query模型生成的,该模型由原作者发布。数据集的主要用途是与`pyterrier_doc2query`包一起使用,以在Doc2Query索引管道中使用。
提供机构:
macavaney
原始信息汇总
数据集概述
数据集名称
- 名称: Doc2Query Generated Queries for
msmarco-passage
数据集来源
- 来源: 基于
msmarco-passage数据集生成
数据集用途
- 用途: 用于Doc2Query索引过程中的预计算生成查询
数据集生成方法
- 生成方法: 使用T5 Doc2Query模型生成查询,该模型由原始作者发布于此处
数据集使用
- 使用方式: 主要用于Doc2Query索引管道,通过
pyterrier_doc2query和pyterrier_pisa包实现
数据集复制
- 复制说明: 由于Doc2Query生成过程的随机性,无法完全复制原始数据集。可通过特定脚本和模型推理尝试复制,但结果可能与原始数据集不完全相同
数据集结构
- 结构: 数据集可通过
Doc2QueryStore直接查询或迭代访问,支持通过文档ID进行查询



