andreaparker/wiki-ss-nq-1000-only

Name: andreaparker/wiki-ss-nq-1000-only
Creator: andreaparker
Published: 2024-12-06 20:26:02
License: 暂无描述

Hugging Face2024-12-06 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/andreaparker/wiki-ss-nq-1000-only

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含查询及其相关文档的信息，主要用于信息检索任务。每个查询（query）都有一个唯一的query_id，并包含一个查询文本（query）。对于每个查询，数据集提供了相关的正面文档（positive_passages）和负面文档（negative_passages），每个文档包含文档ID（docid）、文本内容（text）和标题（title）。此外，数据集还包含每个查询的答案（answers）。数据集分为一个训练集，包含1000个样本，总大小为139483047.95236582字节，下载大小为81700478字节。

This dataset is used for query-passage matching tasks, containing query IDs, query content, positive passages (including document ID, text, and title), negative passages (including document ID, text, and title), and answer sequences. The dataset is divided into a training set with 1000 samples. The download size of the dataset is 81700478 bytes, and the total size of the dataset is 139483047.95236582 bytes.

提供机构：

andreaparker

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是一个包含1000行的小型文本问答数据集，采用Parquet格式，适用于自然语言处理任务。数据包括查询、正负相关文本段落以及答案，旨在支持信息检索和问答模型的训练与评估，内容可能基于维基百科等来源构建。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集