sentence-transformers/NQ-retrieval
收藏Hugging Face2022-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sentence-transformers/NQ-retrieval
下载链接
链接失效反馈官方服务:
资源简介:
#NQ-retrieval
This is a nicely formatted version of the [Natural Questions](https://ai.google.com/research/NaturalQuestions/) dataset, formatted to train and evaluate retrieval systems.
Each row contains the following entries:
- **question**: Original question send for Google Search Engine
- **title**: Title of Wikipedia article
- **candidates**: A list with the passages from the original Wikipedia HTML document
- **passage_types**: Types (text, table, list) of the candidate passages
- **long_answers**: IDs which candidate passages where selected as relevant from annotators. Might be empty if no relevant passage has been identified
- **document_url**
提供机构:
sentence-transformers
原始信息汇总
数据集概述
数据集名称
NQ-retrieval
数据集来源
基于Natural Questions数据集,专门格式化用于训练和评估检索系统。
数据集结构
每条记录包含以下字段:
- question: 用户在Google搜索引擎中提出的原始问题。
- title: 相关Wikipedia文章的标题。
- candidates: 来自原始Wikipedia HTML文档的段落列表。
- passage_types: 候选段落的类型(文本、表格、列表)。
- long_answers: 标注者选定的相关段落ID,如无相关段落则可能为空。
- document_url: Wikipedia文章的URL。



