five

the-coorporation/the_squad_qg

收藏
Hugging Face2023-04-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/the-coorporation/the_squad_qg
下载链接
链接失效反馈
官方服务:
资源简介:
The SQuAD QG Dataset是基于Stanford Question Answering Dataset (SQuAD)的修改版本,旨在用于问题生成。该数据集包含两个配置(v1和v2),每个配置都有训练集和验证集。每个数据实例包含一个上下文(context)和与之相关的问题(questions)。数据集的字段包括context和questions,均为字符串类型。数据集的结构和内容详细描述了每个配置的训练集和验证集的样本数量和字节大小。

The SQuAD QG Dataset是基于Stanford Question Answering Dataset (SQuAD)的修改版本,旨在用于问题生成。该数据集包含两个配置(v1和v2),每个配置都有训练集和验证集。每个数据实例包含一个上下文(context)和与之相关的问题(questions)。数据集的字段包括context和questions,均为字符串类型。数据集的结构和内容详细描述了每个配置的训练集和验证集的样本数量和字节大小。
提供机构:
the-coorporation
原始信息汇总

数据集概述

数据集名称

  • 名称: The SQuAD QG Dataset

数据集版本

  • 版本 v1:

    • 训练集: 18891 个样本,占用 20391081 字节
    • 验证集: 2067 个样本,占用 2389185 字节
    • 下载大小: 25308169 字节
    • 数据集大小: 22780266 字节
  • 版本 v2:

    • 训练集: 18877 个样本,占用 20328952 字节
    • 验证集: 1204 个样本,占用 1419411 字节
    • 下载大小: 24163282 字节
    • 数据集大小: 21748363 字节

数据集特征

  • context: 字符串类型
  • questions: 字符串类型

数据集语言

  • 语言: 英语 (en)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作