erbacher/nq_open5
收藏Hugging Face2023-10-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erbacher/nq_open5
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: query
dtype: string
- name: gold_generation
sequence: string
- name: target
dtype: string
- name: text
dtype: string
- name: results
dtype: string
- name: em
dtype: float64
- name: hal_m
dtype: string
splits:
- name: train
num_bytes: 41737579
num_examples: 79168
- name: dev
num_bytes: 4612579
num_examples: 8757
- name: test
num_bytes: 1950822
num_examples: 3610
download_size: 13126477
dataset_size: 48300980
---
# Dataset Card for "nq_open5"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征项:
- 字段名:query(查询文本)
数据类型:字符串
- 字段名:gold_generation(金标准生成序列)
数据类型:字符串序列
- 字段名:target(目标文本)
数据类型:字符串
- 字段名:text(文本)
数据类型:字符串
- 字段名:results(模型输出结果)
数据类型:字符串
- 字段名:em(精确匹配Exact Match得分)
数据类型:float64(64位浮点型)
- 字段名:hal_m
数据类型:字符串
数据集划分:
- 划分集名称:train(训练集)
字节数:41737579
样本量:79168
- 划分集名称:dev(开发集)
字节数:4612579
样本量:8757
- 划分集名称:test(测试集)
字节数:1950822
样本量:3610
下载大小:13126477
数据集总大小:48300980
---
# 「nq_open5」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
erbacher
原始信息汇总
数据集概述
数据特征
- query: 数据类型为字符串。
- gold_generation: 序列类型为字符串。
- target: 数据类型为字符串。
- text: 数据类型为字符串。
- results: 数据类型为字符串。
- em: 数据类型为浮点数(float64)。
- hal_m: 数据类型为字符串。
数据分割
- train: 包含79168个样本,占用41737579字节。
- dev: 包含8757个样本,占用4612579字节。
- test: 包含3610个样本,占用1950822字节。
数据集大小
- 下载大小: 13126477字节。
- 数据集总大小: 48300980字节。
搜集汇总
数据集介绍

背景与挑战
背景概述
nq_open5是一个包含91,535行文本数据的数据集,格式为parquet,涉及多个领域的问题和答案对。数据集分为train、dev和test三个子集,适用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



