andreaparker/wiki-ss-nq-1000-only
收藏Hugging Face2024-12-06 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/andreaparker/wiki-ss-nq-1000-only
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含查询及其相关文档的信息,主要用于信息检索任务。每个查询(query)都有一个唯一的query_id,并包含一个查询文本(query)。对于每个查询,数据集提供了相关的正面文档(positive_passages)和负面文档(negative_passages),每个文档包含文档ID(docid)、文本内容(text)和标题(title)。此外,数据集还包含每个查询的答案(answers)。数据集分为一个训练集,包含1000个样本,总大小为139483047.95236582字节,下载大小为81700478字节。
This dataset is used for query-passage matching tasks, containing query IDs, query content, positive passages (including document ID, text, and title), negative passages (including document ID, text, and title), and answer sequences. The dataset is divided into a training set with 1000 samples. The download size of the dataset is 81700478 bytes, and the total size of the dataset is 139483047.95236582 bytes.
提供机构:
andreaparker
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含1000行的小型文本问答数据集,采用Parquet格式,适用于自然语言处理任务。数据包括查询、正负相关文本段落以及答案,旨在支持信息检索和问答模型的训练与评估,内容可能基于维基百科等来源构建。
以上内容由遇见数据集搜集并总结生成



